サンプル・プログラム
ヒアドキュメント
0019: $encode = INTERNAL_ENCODING;
0020: echo <<< EOD
0021: <!DOCTYPE html>
0022: <html lang="ja">
0023: <head>
0024: <meta charset="{$encode}">
0025: <title>CSV形式ファイルをHTML TABLEに変換する</title>
0026: <style type="text/css">
0027: table, td, th {
0028: border-collapse: collapse;
0029: border: 1px solid black;
0030: }
0031: </style>
0032: </head>
0033: <body>
0034:
0035: EOD;
input type="file"タグ
0047: <h2>{$title} {$version}</h2>
0048: <form method="post" action="{$myself}" enctype="multipart/form-data">
0049: ファイル選択:<input name="file" type="file" size="80" />
0050: <input type="submit" name="submit" value="変換" />
0051: </form>
1つだけ注意したいのは、type="file" がHTTPサーバに送るデータは、指定されたファイルの中身も含まれているということである。もちろんバイナリ・ファイルも送ることができるので、エンコード・タイプを指定してやらなければならない。通常は、enctype="multipart/form-data"を指定する。type="file"の内容は POST METHOD で送られ、PHP側では配列変数 $_FILE で受け取ることができる。
0064: } else {
0065: if ($_FILES['file']['size'] == 0) {
0066: echo 'Error! - 指定したファイルが見あたりません';
0067: exit(1);
0068: }
また、変数 $_FILES[名前]['tmp_name'] に、送られたファイルのサイズが格納されるので、この値が 0 だったら、ファイル指定が間違っていたとしてエラーを表示する。
CSVファイルのオープン
0069: $source_file = $_FILES['file']['tmp_name']; //アップされたCSVファイル
0070: if (($infp = fopen($source_file, 'r')) == FALSE) {
0071: echo 'Error! - サーバ・トラブルが発生しました';
0072: exit(1);
0073: }
すでに POST されたファイルをオープンするので fopen エラーは発生しないはずだが、念のためエラーチェックを行っている。
ロケールの設定
0075: //ロケール設定
0076: $str = fgets($infp);
0077: if (($enc = mb_detect_encoding($str)) == FALSE) {
0078: echo 'Error! - 文字コードが判定できません';
0079: exit(1);
0080: }
0081: //WindowsなどではFALSEでも正常に変換できる
0082: if (setlocale(LC_ALL, 'ja_JP.' . $enc) == FALSE) {
0083: $warning = '<li>Warning! - OSがロケール ' . 'ja_JP.' . $enc . ' に対応していません.</li>';
0084: }
0085: fseek($infp, 0); //読み込みポインタを先頭へ戻す
ロケール情報とは、言語や国・地域ごとに異なる単位、記号、日付、通貨などの表記規則をあらわす情報だ。
PHP4やWindows環境では指定しなくても大丈夫だが、それ以外の環境では関数 fgetcsv で日本語が文字化けを起こすことがある。

OSによっては、シフトJISに対応するロケールが用意されていなかったりする。
そこで、関数 setlocale の戻り値が FALSE だったら、変数 $warning に警告メッセージを記録し、最後に表示するようにした。
Linux系でロケールが用意されていない場合の対応については「PHPのfgetcsv()がsetlocaleしてもダメな時にやるべきたった一つの事」(たけまるの日記)に詳しい。
この方法でも文字化けが起きる場合は、「PHPでCSVファイルを読み込む(その2)」のプログラムをお試しいただきい。
CSVファイル読み込みと表形式への変換
0087: //CSVファイルの読み込み
0088: echo "<table style=\"border:1px solid;\">\n";
0089: while (($csv = fgetcsv($infp, 1000, $delimiter)) !== FALSE) {
0090: print "<tr>\n";
0091: foreach ($csv as $key=>$val) {
0092: if ($val == '') $val =' '; //デリミタ間にデータが存在しない場合は空白出力
0093: $val = mb_convert_encoding($val, INTERNAL_ENCODING, 'auto'); //コード変換
0094: echo "<td>{$val}</td>\n";
0095: }
0096: echo "</tr>\n";
0097: }
0098: echo "</table>";
fgetcsv (fopenで戻るファイル番号, 最大読み込みバイト数, 区切り文字)

のように使う。戻り値は、区切り文字で区切られた部分文字列からなる配列である。ループ終了条件は、関数 fgets が失敗(ファイル・エンド)するまでである。

関数 fgets で得られた配列(表の1行に相当)を foreach で読み込み、<td> タグで囲みながら表示する。
この際、関数 mb_convert_encoding により、入力ファイルが Shift JIS, EUC-JP, UTF-8 のいずれであっても、自動的に出力エンコード(UTF-8)に変換し、文字化けが起きないようにしている。
foreach が終わったら、<tr> タグで囲む。

なお、このプログラムは、すべての行に同じ数の区切り文字が存在している――列が結合していることはない――ことを前提としている。
ただし、「デリミタの間にデータが存在しない場合、HTMLで空欄をいれたい」という要望があったので、取り出した文字が空である場合、空白文字( )を出力するようにした。

このプログラムはインターネット上のCSV形式ファイルに対しても、まったく同じ手順で表形式に変換することができる。Firefox/Chrome系ブラウザであれば、「ファイルを選択」ボタンをクリックしたときに表示されるファイルダイアログに、CSVファイルのURLを入れることで変換してくれる。
参考サイト
- PHPでCSVファイルを読み込む(その2):ぱふぅ家のホームページ
- PHPのfgetcsv()がsetlocaleしてもダメな時にやるべきたった一つの事:たけまるの日記
そこで今回は、ローカルマシン上にあるCSVファイルを読み込み、HTMLの表に変換するプログラムをつくる。
(2021年2月6日)PHP8対応