Archive for the ‘Tips’ Category

Unicodeの十戒

月曜日, 3月 17th, 2008

via The Ten Commandments of Unicode 我が名はUnicode。汝、我が前にいかなる他のキャラセットも置くべからず。 汝、テキストファイルを読む際は、常に慎重にエンコーディングとキャラセットを唱えるべし。 汝、いかなる8ビットキャラセットも「ASCII」と参照するべからず。 汝、全ての文字をUnicode表の範囲で用いるべし。Unicodeを単なる2バイト文字と捉えるべからず。 汝、Unicodeに新たな文字が追加されることを考慮すべし。 汝、UTF-16ではなく、Unicodeとして文字列のサイズを計るべし。 汝、可能な限りUTF-8を用いるべし。 汝、可能な限り正規化形式Cをもって文字列を作成すべし。 汝、deprecated characters (U+206A-U+206Fあたり) を用いるべからず。 汝、Private Use Area (PUA) の使用を避けるべし。 HOME'Sでも以前はEUCでサイトを作っていましたが、最近はUTF-8で構築することが多くなってきています。 文字コードは、殊にマルチバイト文字を常用する国にとっては、いつも悩み大なる部分。 汝、努々疎かにするべからず、と。