文字コードの問題

1995 年、 Windows95 が発売され、ついにインターネット時代の到来です。とんでもないことが起こりました。なんと、 Windows のパソコンで、 UNIX サーバーのホームページ を見に行く時代がやって来たのです。 Shift_JIS とEUC-JP がモロにぶつかってしまい ます。これが文字化けの原因です。
Shift-JIS とEUC-JP のやりとりで文字化けしないように、プログラムでコード変換、つ まり翻訳をしなければならなくなりました。これに失敗したときに起こるのが、そう、文字化けです。つまり文字化けとは、文字コード変換の失敗のことだったのです!
PHPはサーバー側で動くから文字コードは…
PHP のプログラムやWebサイトは、サーバー側で動作します。サーバーは多くの場合、 UNIX やLinux で構成されています。だからPHPやWebサイトは、サーバー側の文字 コードで記述します。ということは EUC-JP になるのでしょうか。はい、正解でした。 2000 年代までは・・・。
EUC-JP は使いません!「なんで?だってサーバーは UNIX とかinux でしょ?だったらEUC-JP じゃないですか。その通りです。しかし2000 年代後半くらいから究極の文字コードが急速に普 及してきたのです。それがUTF-8です!
究極の文字コードUnicode
UTF-8 は、 Unicode( ユ二コード)という文字コードの一種です。 Unicode は世界中すべての文字に背番号を振って使えるようにしようという考え方に立った規格です。ついに日本の携帯電話の絵文字にまで背番号が振られました。そこまでやるかというくらい徹底してやるのです。なので、 UTF-8 にしておけば、この先よほどの技術革新がない限り 安心して使うことができます。有名サイトも急速に UTF-8 化を進めています。