CJKユニフィケーション

自分の別サイトに中国語表示実験というページを作りました。ページ全体のエンコードはshift-jisですが、サンプル文字列にlang属性を指定しています。特に「為」の字に注意してください。unicodeは日本語、中国語、韓国語の漢字のうちよく似た同じ意味*1の漢字に同じコードを割り当てています(CJKユニフィケーション)。そのため、unicodeにしても正しい字が表示されるわけではなく、本来なら言語属性まで表記しなければなりません。
今日現在、はてなダイアリーはソースで指定したlang属性を剥ぎ取ります。この件に関してはid:yukattiさんも指摘されています。id:yukatti:20040421#1082523290
なお、lang属性の説明をWEBで調べると中国語は"zh"となっていますが、実際には中華人民共和国なのか中華民国なのかまで指定しなければ繁体中国語と簡体中国語と区別することは出来ません。上の例が両者の区別の例として適切かどうかは勉強不足でわかりません。
追記:偶然ながらunicodeの問題を語る上で適切な例だったようです。むぅ。

*1:「それは厳密な説明ではない」という抗議がきそうですが、漢字の国の住人である我々から見るとその程度の発想です

/* -----codeの行番号----- */