2012-01-13から1日間の記事一覧

サロゲートペア文字列の扱いについて

Unicodeで扱う文字の中には、「サロゲートペア」と呼ばれるものがあります。 サロゲートペアとは、Windows Vistaより扱うことができるようになった漢字のうちの一部なのですが、特徴として「1文字4バイト」であることが挙げられます。 Unicodeは通常「1文字2…