Pyppeteer库之二:Pyppeteer的浏览器对象

本文详细介绍了Pyppeteer库中的浏览器对象,包括如何启动浏览器,如launch和content方法,以及各种配置参数如headless、executablePath等。还提到了browser对象的各种方法,如newPage、close、createIncognitoBrowserContext等,并强调了async关键字修饰的异步方法的使用。此外,文章提及了无痕模式(隐身浏览器上下文)的创建和其不保存浏览器数据的特点。
摘要由CSDN通过智能技术生成
启动器Launcher

启动方式:

  • launch :启动链接一个新的浏览器
  • content :链接已打开的浏览器,便于崩溃后重链

1 launch()
pyppeteer.launch(options: dict = None, **kwargs: Any) -> Browser

启动一个新的浏览器,返回 Browser 类。接受字典键值对的关键字配置参数。


常用参数:

  • headless(bool): 是否启用"无头模式"(隐藏浏览器界面),默认为 True 。
  • executablePath(str): 指定 Chromium.exe 文件的路径(不使用内置的chromium)。
  • slowMo(int|float):按指定的毫秒数减慢 pyppeteer 的速度。
  • args(List[str]): 启动 Chromium 的参数。
  • dumpio(bool):是否将浏览器进程标准输出和标准错误输入到 process.stdout 和 process.stderr中。默认是 False。
  • userDataDir(str): 设置用户数据目录。
  • devtools(bool): 是否为每个选项卡自动打开 DevTools 面板, 这个选项只有当 headless 设置为 False的时候有效。

args—>启动chrome的参数:
https://peter.sh/experiments/chromium-command-line-switches/


launch常用参数配置:

kwargs = {
   
    # 启用浏览器界面
    'headless': False,
    # 多开页面,解决卡死
    'dumpio': True,
    # 设置浏览器全屏
    'args': ['--start-maximized',
             # 取消沙盒模式,沙盒模式下权限太小
             '--no-sandbox',
             # 设置浏览器界面大小
             '--window-size=1366,768',
             # 关闭受控制提示:比如,Chrome正在受到自动测试软件的控制...
             '--disable-infobars',
             # 允许跨域
             '--disable-web-security',
             
pyppeteer的成员函数包括: 1. launch:启动浏览器实例。 2. connect:通过连接到一个已存在的浏览器实例来创建浏览器对象。 3. executablePath:获取浏览器可执行文件路径。 4. defaultArgs:获取浏览器默认参数。 5. launch_options:获取启动浏览器实例时的选项。 6. connect_options:获取连接到已存在浏览器实例时的选项。 7. newPage:创建一个新的页面对象。 8. pages:获取所有已存在的页面对象。 9. getBrowserContexts:获取所有浏览器上下文。 10. createIncognitoBrowserContext:创建一个新的无痕浏览器上下文。 11. cookies:获取当前页面的所有 cookies。 12. setCookie:设置一个 cookie。 13. deleteCookie:删除一个 cookie。 14. deleteCookies:删除所有 cookies。 15. userAgent:获取当前页面的 user agent。 16. setViewport:设置当前页面的视口大小。 17. setExtraHTTPHeaders:设置当前页面的额外 HTTP 头。 18. goto:导航到一个 URL。 19. back:回到上一个页面。 20. forward:跳转到下一个页面。 21. reload:重新加载当前页面。 22. evaluate:在当前页面的上下文中执行 JavaScript 代码。 23. evaluateOnNewDocument:在每个新页面中执行 JavaScript 代码。 24. querySelector:查找页面上与指定选择器匹配的第一个元素。 25. querySelectorAll:查找页面上与指定选择器匹配的所有元素。 26. waitForSelector:等待指定选择器的元素出现在页面上。 27. click:模拟单击指定元素。 28. type:在指定元素上模拟输入文本。 29. screenshot:截取当前页面的屏幕快照。 30. pdf:生成当前页面的 PDF 文件。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值