Unicodeの十戒
2008/3/17 月曜日 – 0:44:01 by N.MORIvia The Ten Commandments of Unicode
- 我が名はUnicode。汝、我が前にいかなる他のキャラセットも置くべからず。
- 汝、テキストファイルを読む際は、常に慎重にエンコーディングとキャラセットを唱えるべし。
- 汝、いかなる8ビットキャラセットも「ASCII」と参照するべからず。
- 汝、全ての文字をUnicode表の範囲で用いるべし。Unicodeを単なる2バイト文字と捉えるべからず。
- 汝、Unicodeに新たな文字が追加されることを考慮すべし。
- 汝、UTF-16ではなく、Unicodeとして文字列のサイズを計るべし。
- 汝、可能な限りUTF-8を用いるべし。
- 汝、可能な限り正規化形式Cをもって文字列を作成すべし。
- 汝、deprecated characters (U+206A-U+206Fあたり) を用いるべからず。
- 汝、Private Use Area (PUA) の使用を避けるべし。
HOME’Sでも以前はEUCでサイトを作っていましたが、最近はUTF-8で構築することが多くなってきています。
文字コードは、殊にマルチバイト文字を常用する国にとっては、いつも悩み大なる部分。
汝、努々疎かにするべからず、と。





