文字コードの履歴

開発言語には暗黙の文字コードがあったりするのでメモ。

  • php - 設定ファイルに記述。mb_xxx系の関数はこれに従う。場所は…


別のコードにエンコード後にmb_xxx系のメソッドを何も考えずに呼び出すと2バイト目,3バイト目の文字が大変になったりするのかもしれないと思っている。

  • perl - 指定しない場合はバイナリデータとして扱う。use utf8;をした場合はutf8になる。Perl自体はutf8を基本の文字コードにしていこうという流れがある。

  • python - 確か、ソースのヘッダーに書くんだったような…(うろ覚え)