文字コードについて
久しぶりのエントリーでいろいろと書きたいネタはあるのですが、最近よく悩むことについて書いてみようかと。
まぁ今に始まったことではないんですけれど、webでの文字コードについて。
ただ単にインターネットをやっているだけだと、そこまで気にすることのものでもないのですが、作っている側からすると、これが意外に重要な問題でして。。。
特に、システムが絡んでくると尚更。。。
英語だけなら全然気にすることではないのですが、日本語を表示するにあたって文字コードの制限というのが出てきます。
今現在主流なのが、Shift_JIS。
プログラムが絡んでくると、EUC-JPというのも出てきます。
メールは、JIS。
また、最近になってUTF-8というのも出てきております。
詳しく書くとそれだけで、膨大な量になってしまいますので、それはwikiに任せるとして。。。笑
http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89
こういった文字コードがあるわけですが、例えばHTMLはUTF-8で記述しているけれど、ブラウザ側でShift_JISで表示しようとすると、文字化けします。
これは、きちんとHTML内にを記述しておけば問題なく表示されるのですが、まぁたまにそれがめちゃくちゃなサイトがあります。
たまにホームページを見て文字化けする原因はこういったところにあります。
ただHTMLを作るだけだと、保存するときとタグに気をつければ問題ないのですが、ここにシステムが絡んでくると面倒。。。
今現在は徐々に変わりつつありますが、webサーバの内部でプログラムを処理するには基本的にEUC-JPでスクリプトを書きます。
で、表側のHTMLはShift_JISがメイン。
となってくると、当然システム側で文字コードの処理を行わないといけません。
まぁそれに関してはもう慣れたのですが、表側のHTMLがShift_JISだったり、EUC-JPだったり、UTF-8だったりで、そろそろどれかに統一してもらいたいなぁ〜なんて思ったり。
最近は、ブログの流行りもあり、RSSなどが実装され、HTMLの出力をUTF-8で行っているところが増えてきましたね。
サーバ側もUTF-8の文字コードがデフォルトになったりしたりしているので、これからはUTF-8がデフォルトになってくれるとうれしいなぁ〜なんて思ったり。
Ajaxを実装しようとするときも、何かとUTF-8のほうが便利ですしね。
ただ、UTF-8だと今までShift_JISで書いてたものと微妙に見た目が変わってくるんだよね。。。

