以前、コンテンツ内のリンク切れを調べるプログラムを作ったが、リンク先でリダイレクトしていたりすると、期待する結果が得られないケースがある。 そこで今回は、HTTPレスポンスを調べ、より実用的なプログラムに改良してみることにした。
HTTPレスポンス
HTTP通信とは、
- クライアントがURLを含むHTTPリクエストを送出する
- サーバ側がHTTPレスポンスを返す
――この繰り返しである。
fopen 関数でインターネットにアクセスするときには表に見えないが、実際には、リクエスト・ヘッダとレスポンス・ヘッダがやり取りされている。そして、レスポンス・ヘッダの中には、リクエストしたコンテンツがどうなっているかを示すステータスが記録されている。このステータスを解析することで、リンク切れなのかどうか判断できる。
HTTPレスポンスの詳細については、HTTP Status Codeを参照してほしい。
今回は、HTTPレスポンスがクライアントエラー(4xx番台)とサーバエラー(5xx番台)が「リンク切れ」であると定義し、プログラムを作っていくことにする。
(この項つづく)
| 2007年04月26日更新 | ||
| <<前へ | <目次> | 次へ>> |
| 戻る | 【関連ページ】 | |