Perlで文字化けってどういうことなんだろ?
こんばんは、Perl48です。
前回のエントリーで、
Perlでアマゾンのサイトからスクレイプしてきたテキストが
文字化けしてしまうという憂き目に遭いました。
現状では、
「文字コードの違いが悪影響を及ぼしているんではないか?」
という、おぼろげな仮説があるだけ。
文字コードの違いによる文字化けについて
ビジュアルで体感しようと、テラパッドで実験してみた。
で、
テラパッドの[ファイル]-[文字コード指定再読込]の
次の文字コードを選択してみる
まずは、EUC
お次は、Unicode
最後に、UTF-8
見た目的には、EUCが一番近いかなぁ?
体感してみたものの、解決の糸口はつかめていない(涙)
日本語を扱うプログラムを書く以上は、
文字コードについて学んでおく必要があるなーと
ひしひしと感じましたとさ。