2010-09-10から1日間の記事一覧

プログラマのための文字コード技術入門 第4章「代表的な文字符号化方式」その2

今日は第4章の Unicode の文字符号化方式です。 Unicode の符号化方式 元はシンプルに区点番号を並べた UCS-2, UCS-4 UTF-16 1つの符号位置は基本2バイト。BMP面以外は 4バイト BMP はシンプルに16ビットで符号化できる。他の面はサロゲートペアを用いる サ…