2017-01-17 なんだかメモ帳の文字が変だぞ? 文字コード Windowsのメモ帳(notepad.exe)にコピペした文字を眺めていたら、なんだか変なことになっていることに気付いた。 メモ帳のフォントは "MS ゴシック" のはずなのに、文字がなんだか明朝体っぽいのだ。 もしかして中国の文字か?と思ってWordに貼り付けて調べてみるとUnicode的にF始まりの文字で私用領域よりも外側にあるCJK互換漢字(U+F900~U+FA2D)だった。 詰まるところ外字でしたw 正規化することでCJK統合漢字(JIS第一水準・第二水準)に戻せるっぽいけどなかなか興味深い。 参考Webページ CJK互換漢字 - Wikipedia Unicode一覧 F000-FFFF - Wikipedia