pyppeteer进阶技巧记录一下在使用pyppeteer过程中慢慢发现的一些稍微高级一点的用法。

最新推荐文章于 2024-06-24 22:42:23 发布

0x8g1T9E

最新推荐文章于 2024-06-24 22:42:23 发布

阅读量9.4k

点赞数 5

分类专栏： python

本文链接：https://blog.csdn.net/sirobot/article/details/105541187

版权

https://www.cnblogs.com/dyfblog/p/10887940.html

一、拦截器简单用法

拦截器作用于单个Page，即浏览器中的一个标签页。每初始化一个Page都要添加一下拦截器。拦截器实际上是

通过给各种事件添加回调函数来实现的。

事件列表可参见：pyppeteer.page.Page.Events

常用拦截器：

request：发出网络请求时触发
response：收到网络响应时触发
dialog：页面有弹窗时触发
使用request拦截器修改请求：

复制代码
# coding:utf8
import asyncio
from pyppeteer import launch

from pyppeteer.network_manager import Request

launch_args = {
"headless": False,
"args": [
"--start-maximized",
"--no-sandbox",
"--disable-infobars",
"--ignore-certificate-errors",
"--log-level=3",
"--enable-extensions",
"--window-size=1920,1080",
"--user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36",
],
}

async def modify_url(request: Request):
if request.url == "https://www.baidu.com/":
await request.continue_({"url": "https://www.baidu.com/s?wd=ip&ie=utf-8"})
else:
await request.continue_()

async def interception_test():
# 启动浏览器
browser = await launch(**launch_args)
# 新建标签页
page = await browser.newPage()
# 设置页面打开超时时间
page.setDefaultNavigationTimeout(10 * 1000)
# 设置窗口大小
await page.setViewport({"width": 1920, "height": 1040})

# 启用拦截器
await page.setRequestInterception(True)

# 设置拦截器
# 1. 修改请求的url
if 1:
page.on("request", modify_url)
await page.goto("https://www.baidu.com")

await asyncio.sleep(10)

最低0.47元/天解锁文章

0x8g1T9E

关注

5
点赞
踩
23

收藏

觉得还不错? 一键收藏
1
评论
pyppeteer进阶技巧记录一下在使用pyppeteer过程中慢慢发现的一些稍微高级一点的用法。

https://www.cnblogs.com/dyfblog/p/10887940.html一、拦截器简单用法拦截器作用于单个Page，即浏览器中的一个标签页。每初始化一个Page都要添加一下拦截器。拦截器实际上是通过给各种事件添加回调函数来实现的。事件列表可参见：pyppeteer.page.Page.Events常用拦截器：request：发出网络请求时触发resp...
复制链接

扫一扫