PHPでCSVファイルを読み込む

(1/1)
前回述べたように、PHPは、ローカルマシンにあるファイルと、インターネット上(URL表記)のコンテンツを同等に扱うことができる。
そこで今回は、ローカルマシン上にあるCSVファイルを読み込み、HTMLの表に変換するプログラムをつくる。

(2021年2月6日)PHP8対応

目次

サンプル・プログラム

ヒアドキュメント

0019: $encode = INTERNAL_ENCODING;
0020: echo <<< EOD
0021: <!DOCTYPE html>
0022: <html lang="ja">
0023: <head>
0024: <meta charset="{$encode}">
0025: <title>CSV形式ファイルをHTML TABLEに変換する</title>
0026: <style type="text/css">
0027: table, td, th {
0028:     border-collapse: collapse;
0029:     border: 1px solid black;
0030: }
0031: </style>
0032: </head>
0033: <body>
0034: 
0035: EOD;

全体的に、入力と変換・表示を単一のプログラムファイルで賄うように工夫している。

入出力のためのHTMLタグが多いので、いちいち関数  echo  や  print  を使って出力するのは面倒である。そこで、PHPに用意されている「ヒアドキュメント」という仕組みを利用する。

たとえば、このサンプル・プログラムでは、"<<< EOD" の次の行から "EOD;" の直前行まで、そのままの形で関数  echo  に渡され、画面に表示される。
また、ヒアドキュメントの中には、PHP変数や式を埋め込むことができる。

input type="file"タグ

0047: <h2>{$title} {$version}</h2>
0048: <form method="post" action="{$myself}" enctype="multipart/form-data">
0049: ファイル選択:<input name="file" type="file" size="80" />
0050: <input type="submit" name="submit" value="変換" />
0051: </form>

ローカルマシン上のファイルを選択するダイアログを表示させるためには、HTMLの input type="file" タグを用いる。使い方は、他の input シリーズと同じである。
1つだけ注意したいのは、type="file" がHTTPサーバに送るデータは、指定されたファイルの中身も含まれているということである。もちろんバイナリ・ファイルも送ることができるので、エンコード・タイプを指定してやらなければならない。通常は、enctype="multipart/form-data"を指定する。type="file"の内容は POST METHOD で送られ、PHP側では配列変数 $_FILE で受け取ることができる。

0064: else {
0065:     if ($_FILES['file']['size'] == 0) {
0066:         echo 'Error! - 指定したファイルが見あたりません';
0067:         exit(1);
0068:     }

送られたファイル名は、変数 $_FILES[名前]['tmp_name'] に格納される。名前は、input type="file"に付けた名前である。
また、変数 $_FILES[名前]['tmp_name'] に、送られたファイルのサイズが格納されるので、この値が 0 だったら、ファイル指定が間違っていたとしてエラーを表示する。

CSVファイルのオープン

0069:     $source_file = $_FILES['file']['tmp_name'];       //アップされたCSVファイル
0070:     if (($infp  = fopen($source_file, 'r')) == FALSE) {
0071:         echo 'Error! - サーバ・トラブルが発生しました';
0072:         exit(1);
0073:     }

ファイルの操作は Google news の時と同様、関数  fopen  でオープンし、while ループを繰り返す。
すでに POST されたファイルをオープンするので  fopen  エラーは発生しないはずだが、念のためエラーチェックを行っている。

ロケールの設定

0075:     //ロケール設定
0076:     $str = fgets($infp);
0077:     if (($enc = mb_detect_encoding($str)) == FALSE) {
0078:         echo 'Error! - 文字コードが判定できません';
0079:         exit(1);
0080:     }
0081:     //WindowsなどではFALSEでも正常に変換できる
0082:     if (setlocale(LC_ALL, 'ja_JP.' . $enc) == FALSE) {
0083:         $warning = '<li>Warning! - OSがロケール ' . 'ja_JP.' . $enc . ' に対応していません.</li>';
0084:     }
0085:     fseek($infp, 0); //読み込みポインタを先頭へ戻す

このあと、関数  fgetcsv  を使ってCSVファイルを読み込むのだが、その前に関数  setlocale  を使ってロケール情報を設定しておく。
ロケール情報とは、言語や国・地域ごとに異なる単位、記号、日付、通貨などの表記規則をあらわす情報だ。
PHP4やWindows環境では指定しなくても大丈夫だが、それ以外の環境では関数  fgetcsv  で日本語が文字化けを起こすことがある。

OSによっては、シフトJISに対応するロケールが用意されていなかったりする。
そこで、関数  setlocale  の戻り値が FALSE だったら、変数 $warning に警告メッセージを記録し、最後に表示するようにした。
Linux系でロケールが用意されていない場合の対応については「PHPのfgetcsv()がsetlocaleしてもダメな時にやるべきたった一つの事」(たけまるの日記)に詳しい。
この方法でも文字化けが起きる場合は、「PHPでCSVファイルを読み込む(その2)」のプログラムをお試しいただきい。

CSVファイル読み込みと表形式への変換

0087:     //CSVファイルの読み込み
0088:     echo "<table style=\"border:1px solid;\">\n";
0089:     while (($csv = fgetcsv($infp, 1000, $delimiter)) !== FALSE) {
0090:         print "<tr>\n";
0091:         foreach ($csv as $key=>$val) {
0092:             if ($val == '')        $val ='&nbsp';  //デリミタ間にデータが存在しない場合は空白出力
0093:             $val = mb_convert_encoding($valINTERNAL_ENCODING, 'auto');    //コード変換
0094:             echo "<td>{$val}</td>\n";
0095:         }
0096:         echo "</tr>\n";
0097:     }
0098:     echo "</table>";

ファイルから1行を読み込む際、関数  fgets  の代わりに、関数  fgetcsv  を用いる。関数  fgetcsv  は、

fgetcsv (fopenで戻るファイル番号, 最大読み込みバイト数, 区切り文字)


のように使う。戻り値は、区切り文字で区切られた部分文字列からなる配列である。ループ終了条件は、関数  fgets  が失敗(ファイル・エンド)するまでである。

関数  fgets  で得られた配列(表の1行に相当)を foreach で読み込み、<td> タグで囲みながら表示する。
この際、関数  mb_convert_encoding  により、入力ファイルが Shift JIS, EUC-JP, UTF-8 のいずれであっても、自動的に出力エンコード(UTF-8)に変換し、文字化けが起きないようにしている。
foreach が終わったら、<tr> タグで囲む。

なお、このプログラムは、すべての行に同じ数の区切り文字が存在している――列が結合していることはない――ことを前提としている。
ただし、「デリミタの間にデータが存在しない場合、HTMLで空欄をいれたい」という要望があったので、取り出した文字が空である場合、空白文字(&nbsp;)を出力するようにした。

このプログラムはインターネット上のCSV形式ファイルに対しても、まったく同じ手順で表形式に変換することができる。Firefox/Chrome系ブラウザであれば、「ファイルを選択」ボタンをクリックしたときに表示されるファイルダイアログに、CSVファイルのURLを入れることで変換してくれる。

参考サイト

(この項おわり)
header