Perl楽しいから好き

Perlをはじめとしたプログラミング周りのあれこれについて。モダーンなPerlを楽しんでいます。

Perlで文字化けってどういうことなんだろ?

こんばんは、Perl48です。

前回のエントリーで、
Perlでアマゾンのサイトからスクレイプしてきたテキストが
文字化けしてしまうという憂き目に遭いました。

文字化けの様子はこちら↓


現状では、

文字コードの違いが悪影響を及ぼしているんではないか?」

という、おぼろげな仮説があるだけ。


文字コードの違いによる文字化けについて
ビジュアルで体感しようと、テラパッドで実験してみた。


まず、通常に表示


で、

テラパッドの[ファイル]-[文字コード指定再読込]の
次の文字コードを選択してみる


まずは、EUC


お次は、Unicode


最後に、UTF-8


見た目的には、EUCが一番近いかなぁ?

体感してみたものの、解決の糸口はつかめていない(涙)


日本語を扱うプログラムを書く以上は、
文字コードについて学んでおく必要があるなーと
ひしひしと感じましたとさ。