日本語の「検索語句レポート」や「検索語レポート」がURLエンコードされているせいで
困る事があります.これを解決する為にpostanalogという物もあるのですが
文字化けする部分が多くて使えませんでした.
結局自分で作る事にしたので公開する事にします.
URLエンコードされていて読めない部分を,日本語に変換します.
デコードするべき行を判断して,Jcode.pmでデコードしているだけです.
このプログラムは,analogの出力結果のURLエンコードされた部分をデコードした上で
文字コードを統一するプログラムです.
analogの出力をデコードする仕様になっているので
analog > temp.html urldec.pl temp.html > output.html
とするか,
analog | urldec.pl > output.html
の様にしてください.もちろんファイルの実行権限を付けてあげてください.
デフォルトではEUC-JPを対象にしてるので,analogの設定は
LANGUAGE JAPANESE-EUC
が望ましいですが,ソースの先頭の
$encode = "euc";
の部分を
$encode = "utf8";
等にすればUTF等にも対応できるはずです.(試していません.動作確認をいただけると嬉しいです)
よく分からない点や,うまく動かない例,追加してほしい機能等があれば