時々,文字がぐちゃぐちゃになって読めないページを見かけることがあります.これにはいくつかの理由があります.直せる場合もありますし,直せない場合もあります.文字化けがおきる理由は下記のようなものがあります.
I.文字符号化方法が違う
ページに書かれた文字はそのまま保存されているわけでは無く,符号化されて保存されます.この符号化方法というものはいくつかあってこれによって文字化けが生じる事があります.例えば,符号化方法がShift JISのファイルなのに,ブラウザが,EUCと間違えて解釈してしまったら当然文字化けが発生します.
この場合は他にもEUCで保存されているにも関わらず,ページの作者がShift JISで表示するように指定した場合も文字化けになります.
この場合は文字符号化方法を正しく指定すれば文字化けは解消されます.
II.機種依存文字を使われている
文字化けの原因としてはこちらのほうが多いと思います.機種依存文字とは特定の機械にしか存在しない文字(存在はするがコードは違う文字)のことです.例えばWindowsで「正」という言葉がMacでは「禄」と判断されたら当然文字化けが起こりますよね.このような機種依存文字は結構存在します.
安全な文字
(以下の画像は全て「
機種依存文字劇場」様よりお借りしました.)
また,ここより下部のリンクは一部を除いて上記サイトへのリンクです.
- 半角英数・記号(例:1,A,a,!"#$%..)
- 全角英数・記号(例:1,A,!@#)
- 全角ひらがな・カタカナ(例:あいうえおアイウエオ)
- ほぼ全ての漢字(例:愛上尾下記区家子)→例外あり
- 全角記号文字(ただし下図に表示されている物のみ)
数学記号
JIS・新JIS罫線
ギリシャ文字
ロシア文字
使うと危険な文字
○付き数字,ローマ数字など
2バイト半角文字

↑半角だけど2バイトな文字です.
NEC特殊記号
Mac文字
Mac文字(半角)
MSX文字
X68000文字
i-mode 絵文字
J-sky絵文字
ezWeb絵文字