Unicodeの十戒

2008/3/17 月曜日 – 0:44:01 by N.MORI

via The Ten Commandments of Unicode

  1. 我が名はUnicode。汝、我が前にいかなる他のキャラセットも置くべからず。
  2. 汝、テキストファイルを読む際は、常に慎重にエンコーディングとキャラセットを唱えるべし。
  3. 汝、いかなる8ビットキャラセットも「ASCII」と参照するべからず。
  4. 汝、全ての文字をUnicode表の範囲で用いるべし。Unicodeを単なる2バイト文字と捉えるべからず。
  5. 汝、Unicodeに新たな文字が追加されることを考慮すべし。
  6. 汝、UTF-16ではなく、Unicodeとして文字列のサイズを計るべし。
  7. 汝、可能な限りUTF-8を用いるべし。
  8. 汝、可能な限り正規化形式Cをもって文字列を作成すべし。
  9. 汝、deprecated characters (U+206A-U+206Fあたり) を用いるべからず。
  10. 汝、Private Use Area (PUA) の使用を避けるべし。

HOME’Sでも以前はEUCでサイトを作っていましたが、最近UTF-8で構築することが多くなってきています。
文字コードは、殊にマルチバイト文字を常用する国にとっては、いつも悩み大なる部分。
汝、努々疎かにするべからず、と。

TAG:
はてブに追加する buzzurlに追加するバザール数 del.icio.usに追加する Livedoor Clipに追加する nifty clipに追加する Spank this Page!

Post a Comment