【PHP】DOM要素をスクレイピングするSimple_HTML_DOMの使い方。

めも。

1, 下記URLからライブラリをダウンロード。

http://simplehtmldom.sourceforge.net/

2, 落としたファイルの中から「simple_html_dom.php」を探しインクルードなりオートロードなりする。

3, あとは下記のように使う。

$url = 'http://example.com/';

$html = file_get_html($url);

$a = $html->find('a');

foreach($a as $elem) {
	echo $elem->href;
}

上記は取得したページに存在するa要素のhref属性を全て出力する処理の例。

find()関数にはjQueryセレクタと同じ文字列を渡せるためとても使いやすい。

さらなる詳細や応用方法は下記本家ドキュメントを参照されたし。

http://simplehtmldom.sourceforge.net/manual.htm