プログラマのための文字コード技術入門 第3章「代表的な符号化文字集合」その1
お休みがかさなって一週間も間があいてしまいました。また粛々と読んでいきます。今日は 2章の最後 Unicode の誕生から、3章へ突入しました。
- Unicode と ISO/IEC 10646 の誕生ドラマ。でもまだ Unicode に統一されていくというわけでもない。
- ASCII, ISO/IEC 646
- ISO/IEC 646 には「○○版」というのがあって記号がすりかえられてたりする。
- 0x7E は「歴史的にチルダとオーバランどちらでもいいという扱いになっていた」でも今はチルダだと
- JIS X 0201
- ISO/IEC 646 の日本版。いわゆる Shift JIS の原型
- Shift JIS のチルダ問題
- JIS X 0208
- いわゆる漢字の JIS コードってやつ?
- えっ、「丼」って第二水準漢字なのか!
- 字体の簡略化や包摂基準は細かいけどむつかしい問題ですね。こだわりたい人はこだわりたいでしょうし
- 幽霊文字の調査の話がとてもおもしろい
思い知りました。日本語(漢字)、難しいですね……。