プログラマのための文字コード技術入門 第3章「代表的な符号化文字集合」その2

JIS X 0208 の続きからです

  • JIS X 0208
    • 外字 いわゆる機種依存文字の話題。独自拡張のせいで文字化けの原因に
  • JIS X 0212
  • JIS X 2013
    • あまり使われなかった JIS X 2012 のリベンジで JIS X 0208 を内包するスーパーセットとして定義された規格。
    • 漢字集合を2面用意して GR に呼び出して使う
    • 漢字むつかしい
    • 符号化方式も9つも定義されている。もうわけがわかりません……
  • ISO/IEC 8859 シリーズ
    • がらっとかわって欧米の1バイト文字集合
    • Latin-1 (ISO/IEC 8859-1)
      • ウムラウトつきの文字などや記号
      • NBSP(ノーブレークスペース)とSHY(ソフトハイフン)

個人的にはアイヌ語の発音のための文字が取り入れられているというのが感心しました。