使用PHP 開源類來分析HTML

Sourceforge上有一个PHP的分析类,可以从这里下载 。  

 

采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。

請參考 http://simplehtmldom.sourceforge.net/

特色


1. 只支持PHP5以上
2. 可以分析不怎么严谨(invalid)的HTML代码
3. 支持简单的CSS Selector.
4. 支持简单的DOM操作
5. 保持HTML中的原始格式

 

$html = file_get_html($url);

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';



// Find all links
foreach($html->find('a') as $element){
/* 出來的效果大概是這樣
http://www.phpfans.net/manu/javascript/    a   
 <a href="http://www.phpfans.net/manu/javascript/" target="_blank">javascript 手册</a>    
 javascript 手册    javascript 手册
 <br>http://www.phpchina.com/    a    <a href="http://www.phpchina.com/" target="_blank">PHPChina</a>    PHPChina    PHPChina<br>
http://www.phpfans.net/    a    <a href="http://www.phpfans.net/" target="_blank">php爱好者</a>    php爱好者    php爱好者 <br>http://www.phpv.net/    a    <a href="http://www.phpv.net/" target="_blank">PHP5研究室</a>    PHP5研究室    PHP5研究室<br><br> <br>http://www.phpx.co
*/
	 echo $element->href .'    '. $element->tag 
	 .'    '. $element->outertext .'    '. $element->innertext .'    '. $element->plaintext	 .'<br>'; 
       
}
 

deme頁:  http://wasa.sinaapp.com/demo/curl.php




參考轉載于 : 使用PHP简单分析HTML

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值