Sourceforge上有一个PHP的分析类,可以从这里下载 。
采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。
請參考 http://simplehtmldom.sourceforge.net/
特色
1. 只支持PHP5以上
2. 可以分析不怎么严谨(invalid)的HTML代码
3. 支持简单的CSS Selector.
4. 支持简单的DOM操作
5. 保持HTML中的原始格式
$html = file_get_html($url);
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element){
/* 出來的效果大概是這樣
http://www.phpfans.net/manu/javascript/ a
<a href="http://www.phpfans.net/manu/javascript/" target="_blank">javascript 手册</a>
javascript 手册 javascript 手册
<br>http://www.phpchina.com/ a <a href="http://www.phpchina.com/" target="_blank">PHPChina</a> PHPChina PHPChina<br>
http://www.phpfans.net/ a <a href="http://www.phpfans.net/" target="_blank">php爱好者</a> php爱好者 php爱好者 <br>http://www.phpv.net/ a <a href="http://www.phpv.net/" target="_blank">PHP5研究室</a> PHP5研究室 PHP5研究室<br><br> <br>http://www.phpx.co
*/
echo $element->href .' '. $element->tag
.' '. $element->outertext .' '. $element->innertext .' '. $element->plaintext .'<br>';
}
deme頁: http://wasa.sinaapp.com/demo/curl.php
參考轉載于 : 使用PHP简单分析HTML