日本語の「検索語句レポート」や「検索語レポート」がURLエンコードされているせいで
困る事があります.これを解決する為にpostanalogという物もあるのですが
文字化けする部分が多くて使えませんでした.
結局自分で作る事にしたので公開する事にします.
URLエンコードされていて読めない部分を,日本語に変換します.

ソース

デコードするべき行を判断して,Jcode.pmでデコードしているだけです.

必要な物

  • perl
    LinuxやBSDを使っていれば平気ですね.Windowsの場合はActivePerlとかが必要です.
  • Jcode.pm
    Encodeを使えばよかったのですが,使い方を知らないので^^;

使い方

このプログラムは,analogの出力結果のURLエンコードされた部分をデコードした上で
文字コードを統一するプログラムです.
analogの出力をデコードする仕様になっているので

analog > temp.html
urldec.pl temp.html > output.html

とするか,

analog | urldec.pl > output.html

の様にしてください.もちろんファイルの実行権限を付けてあげてください.

デフォルトではEUC-JPを対象にしてるので,analogの設定は

LANGUAGE JAPANESE-EUC

が望ましいですが,ソースの先頭の

$encode = "euc";

の部分を

$encode = "utf8";

等にすればUTF等にも対応できるはずです.(試していません.動作確認をいただけると嬉しいです)

コメント

よく分からない点や,うまく動かない例,追加してほしい機能等があれば


お名前:
添付ファイル: fileurldec.pl 1602件 [詳細]