プログラマのための文字コード技術入門 第3章「代表的な符号化文字集合」その4

Unicode の続きからです

  • Unicode ISO/IEC 10646(UCS)
    • UCS-4
      • 群(group), 面(plane), 区(row), 点(cell) の4バイトで指定
    • UCS-2
    • 実質的に 群00以外の群は利用されない
    • 記法。U+4E00 は BMP の 区4E 点00 の符号位置(漢字の'一'がわりあてられている)

今日も時間切れ。
Unicode はよく知っておいたほうがよいと思うのでまだまだじっくり読みます。