多国語処理に関するコメント

台湾の方が日本語で動作しているWEBシステムへの書き込みに関して興味深い言及をされています。

しかし、IE4・NN4からは多国語を対応しました。投稿のときもページのコードをチェックして、正確のコードでデータを送ります。該当のコードにない文字があれば、自動的に数値参照に転換するのは普通です。
つまりIEは自動に外字を数値参照に転換してくれますから、普通の場合ははてなのようにはじかれることが殆どありません。はてなだけトラブルがあるそうです。

面白い。経験に基づく意見だけに重みがあります。自分が持っている別サイトのBBSで実験をして見ました。確かにIEはShift-JISにない漢字を数値文字参照に変換して書き込みます。ところで、実験によるとWEBページがEUC-jpであっても正しく数値文字参照に変換していました。つまりIEは無実です*1
はてなには何かがあるように思えるのですが、一方で「EUC-jpやshift-jisの時だけ数値文字参照に変換する」というのはIE固有の機能ですので、これに頼りすぎるのも危険かなと思います。この点、判断がつきません。

*1:Mozilla Firefoxは無理やりUnicodeで書き込みます

/* -----codeの行番号----- */