相关内容: pyquery的介绍
pyquery的使用 安装模块
导入模块
解析对象初始化
css选择器
在选定元素之后的元素再选取
元素的文本、属性等内容的获取
pyquery执行DOM操作、css操作 Dom操作
CSS操作
一个利用pyquery爬取豆瓣新书的例子
首发时间:2018-03-09 21:26
pyquery的介绍 pyquery允许对xml、html文档进行jQuery查询。
pyquery使用lxml进行快速xml和html操作。
pyquery是python中的jquery
PyQuery的使用:
1.安装模块:
pip3 install pyquery
2.导入模块:
from pyquery import PyQuery as pq
3.解析对象初始化:
【使用PyQuery初始化解析对象,PyQuery是一个类,直接将要解析的对象作为参数传入即可】
解析对象为字符串时字符串初始化 :默认情况下是字符串,如果字符串是一个带http\https前缀的,将会认为是一个url
textParse = pq(html)
解析对象为网页时url初始化: 建议使用关键字参数url=
#urlParse = pq('http://www.baidu.com') #1
urlParse = pq(url='http://www.baidu.com') #2
解析对象为文件时文件初始化:建议使用关键字参数filename=
fileParse = pq(filename="L:\demo.html")
解析完毕后,就可以使用相关函数或变量来进行筛选,可以使用css等来筛选,
4.CSS选择器:
利用标签获取:
result = textParse('h2').text()
利用类选择器:
result3=textParse(".p1").text()
利用id选择:
result4=textParse("#user").attr("type")
分组选择:
result5=textParse("p,div").text()
后代选择器:
result6=textParse("div a").attr.href
属性选择器:
result7=textParse("[