[Python数据采集]Playwright-新一代数据采集神器入门（二）-详细语法

最新推荐文章于 2024-09-14 19:55:48 发布

William数据分析

最新推荐文章于 2024-09-14 19:55:48 发布

阅读量529

点赞数 9

分类专栏： python 文章标签： python 算法爬虫程序人生数据分析大数据

本文链接：https://blog.csdn.net/weixin_45933029/article/details/142181137

版权

Playwright 提供了非常灵活且丰富的 API，使得用户可以轻松实现浏览器自动化任务。接下来，我将详细介绍一些 Playwright 中常见的语法和参数，并结合实际的 Python 代码举例说明这些 API 的使用方法和技巧。

1.Browser Launch (启动浏览器)

Playwright 支持启动多种浏览器：Chromium、Firefox 和 WebKit。我们可以通过指定参数来控制浏览器的行为。

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    # 启动 Chromium 浏览器，无头模式（默认值为 True 表示无头模式）
    browser = p.chromium.launch(headless=False, slow_mo=50)
    # 打开一个新的页面
    page = browser.new_page()
    page.goto('https://example.com')
    # 打印页面标题
    print(page.title())
    # 关闭浏览器
    browser.close()
)

常见参数：

headless: 控制是否无头模式（即不显示浏览器窗口），默认是 True。
slow_mo: 设置浏览器动作的延迟，单位为毫秒。可以用于调试时观察自动化操作。
args: 可以传递启动浏览器时的命令行参数，例如设置代理、窗口大小等。

browser = p.chromium.launch(headless=False, args=['--window-size=1280,720'])

2.New Context (创建新浏览器上下文)

每个浏览器上下文（BrowserContext）是独立的，可以用来隔离不同的会话、Cookie、缓存等信息。

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    
    # 创建一个新的浏览器上下文（可以模拟不同的用户会话）
    context = browse

最低0.47元/天解锁文章

William数据分析

关注

9
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录