php解析html页面工具 simple html dom 使用的简单介绍:
(1)下载( http://sourceforge.net/projects/simplehtmldom/files/ ) ;
(1)下载( http://sourceforge.net/projects/simplehtmldom/files/ ) ;
(2)解压,manual目录是使用文档(很容易看懂的,也可以看这里http://simplehtmldom.sourceforge.net/),example目录是一些实例,可以参考使用;
(3)中文手册(http://www.ecartchina.com/php-simple-html-dom/manual.htm);
(4)使用代码示例:
1
2
3
4
5
6
7
8
9
|
require
"simplehtmldom/simple_html_dom.php"
;//加载simple_html_dom文件
$html
= file_get_html('http://www.abc.com'
);
// 查找class=quizPutTag的div,也可以根据div的id获取
$type_fill
=
$html
->find(
'div.quizPutTag'
);
foreach
(
$type_fill
as
$r
) {
$content
=
$r
->innertext;
}
|
1
2
3
4
5
|
// 查找class=pt2的div中的table tbody tr 中的class=s的label标签
$type_choice
=
$html
->find(
'div.pt2 table tbody tr label.s'
);
foreach
(
$type_choice
as
$r
) {
$content
=
$r
->innertext;
// 获取标签里的所有内容,包括html标签
}
|
1
2
3
4
5
|
// 获取页面中所有的img标签的url
$imgs
=
$content_fromfile
->find(
'img'
);
foreach
(
$imgs
as
$e
) {
$src
=
$e
->src;
}
|
1
2
3
4
5
6
7
|
// 获取选中/未选中复选框的name属性
foreach
(
$html
->find(
'input[type=checkbox]'
)
as
$checkbox
) {
if
(
$checkbox
->checked)
echo $checkbox->name . ' is checked<br>';
else
echo $checkbox->name . ' is not checked<br>';
}
|
1
2
|
// 修改页面中id=hello的div的值
$html
->find(
'div[id=hello]'
, 0)->innertext =
'foo'
;
|