python pyquery_python爬虫之pyquery学习

相关内容: pyquery的介绍

pyquery的使用 安装模块

导入模块

解析对象初始化

css选择器

在选定元素之后的元素再选取

元素的文本、属性等内容的获取

pyquery执行DOM操作、css操作 Dom操作

CSS操作

一个利用pyquery爬取豆瓣新书的例子

首发时间:2018-03-09 21:26

pyquery的介绍 pyquery允许对xml、html文档进行jQuery查询。

pyquery使用lxml进行快速xml和html操作。

pyquery是python中的jquery

PyQuery的使用:

1.安装模块:

pip3 install pyquery

2.导入模块:

from pyquery import PyQuery as pq

3.解析对象初始化:

【使用PyQuery初始化解析对象,PyQuery是一个类,直接将要解析的对象作为参数传入即可】

解析对象为字符串时字符串初始化 :默认情况下是字符串,如果字符串是一个带http\https前缀的,将会认为是一个url

textParse = pq(html)

解析对象为网页时url初始化: 建议使用关键字参数url=

#urlParse = pq('http://www.baidu.com') #1

urlParse = pq(url='http://www.baidu.com') #2

解析对象为文件时文件初始化:建议使用关键字参数filename=

fileParse = pq(filename="L:\demo.html")

解析完毕后,就可以使用相关函数或变量来进行筛选,可以使用css等来筛选,

4.CSS选择器:

利用标签获取:

result = textParse('h2').text()

利用类选择器:

result3=textParse(".p1").text()

利用id选择:

result4=textParse("#user").attr("type")

分组选择:

result5=textParse("p,div").text()

后代选择器:

result6=textParse("div a").attr.href

属性选择器:

result7=textParse("[

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值