pyppeteer的基本语句

pyppeteer库安装

1、库安装 pip install pyppeteer
2、浏览器安装 pyppeteer-install
3、导入库 from pyppeteer import launch

运行页面

1、页面信息
browser = await launch(headless=False, userDataDir=’./userdata’)
page = await browser.newPage()
2、页面大小
await page.setViewport({‘width’: 1366, ‘height’: 768})
3、访问页面
await page.goto(“URL”)
4、页面滚动函数
在这里插入图片描述
引用语句:await scroll_screen(page)
5、关闭页面函数
在这里插入图片描述
引用语句:await page_close(browser)

内容抓取

以下图为例
在这里插入图片描述
1、JJ、J方法
JJ出来的需要遍历 J出来的不需要遍历
labels = await page.JJ(’.hotel_item’)
for label in labels:
#下边记得缩进
a = await label.J(’ 标签路径,如li.pic_medal > div > a’)
# 用getProperty函数获取属性值
id=await (await a[0].getProperty(‘textContent’)).jsonValue()
# class属性、绑定数据属性等用getProperty函数获取不到属性值
id = await page.evaluate(’(el) => el.getAttribute(“data-hotel”)’, a)
2、xpath方法
labels = await page.xpath("//*[@id=‘hotel_list’]/div")
for label in labels:
a = await label.xpath(".//ul[@class=‘hotel_item’]/li[@class=‘hotel_item_name’]/h2[@class=‘hotel_name’]/a")
#与上述获取方法一致
name = await (await a[0].getProperty(‘textContent’)).jsonValue()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值