サンプル・プログラムの解説:HTMLタグを除く |
|
|
0035: mb_internal_encoding("Shift_JIS"); |
|
|
ファイルを読み込む部分の流れは、以前のプログラムと同じである。違うのは、1行読み込みのための関数として fgetss を使っていることだ。 関数 fgetss は、ファイルから 1行読み込むと同時に、HTML タグや PHP プログラムを除く。戻り値は、タグなどを除いたあとの文字列である。 オプションで一部のタグを残しておくこともできる。table, tr, td タグのみを残しておきたいなら、fgetss($fp_in, 1000, "<table><tr><td>") のように記述する。 |
サンプル・プログラムの解説:文字コード変換 |
|
|
次に、入力された文字列をシフト JIS に変換する。この処理は関数 mb_convert_encoding を使えばよい。 日本語サイトなら、シフト JIS, EUC-JP, UTF-8 のいずれかで構成される HTML コンテンツがほとんどなので、第3 引数は "Shift_JIS, EUC-JP, UTF-8" のように記述した。 なお、内部処理はシフト JIS で行うので、事前に関数 mb_internal_encoding により内部処理コードを規定している。 |
|
(
この項つづく)
|
|
|
|
|
2006年12月09日 作成
2009年06月26日 更新
Copyright by studio pahoo, (C)2009
(※)本ページはリンクフリーですが、複製・転載時にはご一報ください。 ★本ページへのご意見・ご質問・お便りは、ここをクリックしてください。 |