プログラマのための文字コード技術入門 第3章「代表的な符号化文字集合」その1

お休みがかさなって一週間も間があいてしまいました。また粛々と読んでいきます。今日は 2章の最後 Unicode の誕生から、3章へ突入しました。

  • UnicodeISO/IEC 10646 の誕生ドラマ。でもまだ Unicode に統一されていくというわけでもない。
  • ASCII, ISO/IEC 646
    • ISO/IEC 646 には「○○版」というのがあって記号がすりかえられてたりする。
    • 0x7E は「歴史的にチルダとオーバランどちらでもいいという扱いになっていた」でも今はチルダだと
  • JIS X 0201
  • JIS X 0208
    • いわゆる漢字の JIS コードってやつ?
    • えっ、「丼」って第二水準漢字なのか!
    • 字体の簡略化や包摂基準は細かいけどむつかしい問題ですね。こだわりたい人はこだわりたいでしょうし
    • 幽霊文字の調査の話がとてもおもしろい

思い知りました。日本語(漢字)、難しいですね……。