php采集器,PHP采集利器之phpQuery的用法详解 - 金牛座, 爬山虎, PHPCreeper, Workerman, Swoole, PHP爬虫引擎, PHP爬虫框架, 网页采集器, 数据抓...

官方文档地址:

See Gitub:

基础用法:

require_once "/path/to/phpQuery/phpQuery.php";

phpQuery::newDocumentFile('http://www.blogdaren.com');

echo pq("title")->text(); // 获取网页标题

echo pq("input#uid")->val(); // 获取id为uid的input的控件值

上例中第一行引入phpQuery.php文件,

第二行通过newDocumentFile加载一个文件,

第三行通过pq()函数获取title标签的文本内容,

第四行获取id为uid的input控件的值,

上述代码主要做了两件事:即加载文件和读取文件内容。

加载文档:

加载文档主要通过phpQuery::newDocument来进行操作,其作用是使得phpQuery可以在服务器预先读取到指定的文件或文本内容。

主要的方法包括:

phpQuery::newDocument($html, $contentType = null)

phpQuery::newDocumentFile($file, $contentType = null)

phpQuery::newDocumentHTML($html, $charset = "utf-8")

phpQuery::newDocumentXHTML($html, $charset = "utf-8")

phpQuery::newDocumentXML($html, $charset = "utf-8")

phpQuery::newDocumentPHP($html, $contentType = null)

phpQuery::newDocumentFileHTML($file, $charset = "utf-8")

phpQuery::newDocumentFileXHTML($file, $charset = "utf-8")

phpQuery::newDocumentFileXML($file, $charset = "utf-8")

phpQuery::newDocumentFilePHP($file, $contentType)

pq()函数用法:

pq()函数的用法是phpQuery的重点,主要分两部分:即选择器和过滤器

1. 选择器

要了解phpQuery选择器的用法,建议先了解jQuery的语法,最常用的语法包括有:

pq('#id'):即以#号开头的ID选择器,用于选择已知ID的容器所包括的内容

pq('.classname'):即以.开头的class选择器,用于选择class匹配的容器内容

pq('parent > child'):选择指定层次结构的容器内容,如:pq('.main> p')用于选择class=main容器的所有p标签

2. 过滤器

主要包括::first,:last,:not,:even,:odd,:eq(index),:gt(index),:lt(index),:header,:animated等,例如:

pq('p:last'):用于选择最后一个p标签

pq('tr:even'):用于选择表格中偶然行

phpQuery连贯操作:

pq()函数返回的结果是一个phpQuery对象,可以对返回结果继续进行后续的操作,例如:

pq('a')->attr('href', 'newVal')->removeClass('className')->html('newHtml')->......

详情请查阅jQuery相关资料,用法基本一致,只需要注意 . 与 -> 的区别即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值