phpQuery分析网页文本

抓取网页文本,通常做法是采用正则表达式,但是对于正则表达式不熟悉的人可能就难啦。phpQuery就是可以不用正则,就像jquery一样,分析网页元素。

比如说我要获取class为.test的元素的文本

在jquery中,我们可以这样写:

$(".test").text();

获取html内容:

$(".test").html();

 

呢么我们采用phpQuery类似于这种写法。

首先下载phpQuery,http://code.google.com/p/phpquery/

 

解压缩后放到工程目录下面,导入phpQuery.php

代码如下:

require_once("plugins/phpQuery/phpQuery/phpQuery.php");
 $t = file_get_contents("http://blogread.cn/it/article/1617?f=wb");

 file_put_contents("d:/project/joomla/test.html", $t);
  $html =  phpQuery::newDocumentFileHTML("d:/project/joomla/test.html","utf-8");
    echo $html->find(".topnav")->html();

 它还可以解析xml,等格式。更多的用法,可以参考目录里面的demo.php。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值