ヨーロッパの言葉の研究(メモ書き)

ヨーロッパの言葉は英語のアルファベットと文字が似ているため、十把ひとからげで「ヨーロッパ言語」として文字コーディングされる場合があります。この場合、特別なコーディング規則を使わずに1バイトで表現可能です。アイルランド語を書いていらっしゃるid:michealhさんによると、Windowsを使ってはてなに直接アイルランド語の文字を書き込むことが出来るようです(id:michealh:20040311)。さっそくWindowsXPに英語(アイルランド)キーボードのドライバを入れて実験してみました。michealhさんのページソースを見ると、きちんと数値文字参照が使われています。

  • Mozilla Firefoxでファダ付の文字を直接入力すると、1バイトの西ヨーロッパ文字として入力されます。これはEUC-jpのコーディングとしては違反ではないでしょうか。こうして入力したページはうまく表示されますが、IEで編集しようとするとぐちゃぐちゃに壊れました。おそらくFirefoxの問題です。
  • IEでファダ付の文字を直接入力すると、?Dに登録できませんでした。
  • 10進、16進文字コードin HTMLユニコードにファダ付文字を入力して数値文字参照に変換した後?Dのテキストエリアに貼り付けると、うまく表示されます。
  • ファダ付文字(アイルランド語):áíúéó

このことから、西ヨーロッパ言語のように英語に近い(と、私のような素人には見える)言語も、数値文字参照に変換して入力したほうがよいようです。

/* -----codeの行番号----- */