最近サロゲート文字とか普通だから忘れていたけど、Terarame内部処理の文字コードはMBCS(Multiple Byte Character Set)だった…
Normalization Form D (NFD) で符号化した UTF-8 のことを指します。 一般に UTF-8 とだけいった場合には、Normalization Form C (NFC) でエンコードされたものを意味します。 Unicode 標準では、NFC は正規結合(Canonical Composition)、 NFD は正規分解(Canonical Decomposition)として規定されています。 たとえば、「が」の字を NFC で表現すると U+304C (HIRAGANA LET
lvコマンドの使い方 -I 入力 -O 出力 j ej u8 s