python爬虫----pyquery选择器

使用pyquery选择器爬取豆瓣读书《未来简史》短评
如下为部分短评:
在这里插入图片描述
F12或者右键–审查元素,如图:
在这里插入图片描述
pyquery使用心得:一层一层剥洋葱,即从上往下一层一层提取元素。
使用方法:

id--"#",如<div id="wrapper">,则为'div#wrapper'
class--".",如<div class="grid-16-8 clearfix">,则为'div.grid-16-8' 

以下为详细代码:

#导入需要使用的库
import requests
from pyquery import PyQuery
#网页链接
url = 'https://book.douban.com/subject/26943161/comments/'
response = requests.get(url).text
#pyquery选择器
jpy = PyQuery(response)
#输出内容为文本:text,输出内容为图片:content
comment = jpy('body>div#wrapper>div#content>div.grid-16-8>div.article>div.comments-wrapper>div#comment-list-wrapper>div#comments>ul>li>div.comment>p>span').text() 
print(comment)    

爬取结果:
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值