プログラマのための文字コード技術入門 Appendix A.4 - A.6

今日で Appendix も終わって文字コード本ともお別れです。

  • A.4 Unicode の諸問題
    • 合成文字と正規化の問題
    • 漢字の包摂の問題
      • 日本と台湾で字体の違いを表現する符号位置が異なるとか……もうちょっとみんな仲良くしようよ!!
    • 異字体セレクタ
      • 漢字毎に微妙な字形の違いを指定できる
      • U+E0101 のような符号位置が現れることがある
    • 絵文字
      • 携帯キャリア独自の絵文字を Unicode にまとめて一部包摂
      • 絵文字の包摂……
      • 日本独自のものを Unicode に入れていいのかというような問題
    • 書字方向の制御
      • 文字を左から書くか右から書くかを指示する制御文字がある
      • 拡張子の偽装などに使われセキュリティ上の問題になりうる
  • A.5 EmacsSKK による JIS2004 の活用
    • JIS X 2013 の文字を普通に変換で入力できるらしい(辞書を入れれば)
  • A.6 規格の入手・閲覧ならびに参考文献
    • JIS 規格って買わないといけないんですよね。川崎図書館では2階に JIS 規格のコーナーがあって閲覧できます。ここ行ったことありますが今思うととても貴重な場所ですね。

以上で「プログラマのための文字コード技術入門」は終わりです。長い休みが挟まったこともあって1月半くらいかかってしまいました。最初の予定ではもうちょっと早く読みたかったのですが。

次の本ですが、「メタプログラミング Ruby」にすることにしました。前半がストーリー調になってて読みやすそうです。