PHPでワードクラウドをつくる

(3/3)

サンプル・プログラムの解説:コマンドラインと文字コード

0308: //入力サイトのエンコード方式
0309: $InEncoding = isset($_GET['inenc']) ? $_GET['inenc'] : 'auto';
0310: //出力サイトのエンコード方式
0311: $OutEncoding = isset($_GET['outenc']) ? $_GET['outenc'] : $InternalEncoding;
0312: 
0313: //パラメータを取り出す
0314: if (isset($_GET['url'])) {
0315:     $url = $_GET['url'];
0316:     $flag_header = isset($_GET['exec']) ? TRUE : FALSE;
0317: else {
0318:     $url = '';
0319:     $flag_header = TRUE;
0320: }
0321: if (isset($_GET['reset'])) {
0322:     $url = '';
0323:     $flag_header = TRUE;
0324: }

おまけ機能として、コマンドラインで URL を指定すると、URL 入力画面などを表示せず、ワードクラウドのみを表示する機能を加えた。
コマンドラインで与える URL は、URL エンコードしておくこと。
たとえば
WordCloud.php?url=http%3A%2F%2Fwww.pahoo.org%2Fathome%2Fvehicle%2Fjrkyushu%2Fimg20080729-164625.html
のように指定する。
space
ワードクラウドの部分のみ独立して使うことを想定し、入力サイトのエンコード方式を変数 $InEncoding に、出力サイトのエンコード方式を変数 $OutEncoding にセットするようにした。これらの変数は、コマンドラインから inenc、outenc で指定できるようにしてある。
たとえば、シフト JIS のコンテンツを処理し、EUC-JP で出力したい場合には以下のように指定する。
WordCloud.php?url=http%3A%2F%2Fwww.pahoo.org%2Fe-soul%2Fgadget%2F1981%2Ftp-s30.shtm&inenc=SJIS&outenc=EUC-JP

space

参考サイト

参考書籍

(この項おわり)
header