pip3 install playwright
第 2 步, 安装主流的浏览器驱动
这样,会将 Chromeium、Firefox、Webkit 浏览器驱动下载到本地
# 安装浏览器驱动
python -m playwright install
3. 实战一下
3-1 录制脚本
我们先查看录制脚本的命令说明
其中
python -m playwright codegen 录制脚本
--help 帮助文档
-o 生成自动化脚本的目录
--target 脚本语言, 包含 JS 和 Python,分别对应值为:python 和 java
-b 指定浏览器驱动
# 我们通过下面命令打开 Chrome 浏览器开始录制脚本
# 指定生成语言为:Python(默认Python,可选)
# 保存的文件名:1.py(可选)
# 浏览器驱动:webkit(默认webkit,可选)
# 最后跟着要打开的目标网站(默认仅仅是打开浏览器,可选)
python -m playwright codegen --target python -o '1.py'-b webkit https://www.baidu.com
接着,在浏览器模拟搜索一次的操作,然后关闭浏览器
最后,自动化脚本会自动生成,保存到文件中
fromplaywright importsync_playwright
defrun(playwright):
browser = playwright.webkit.launch(headless= False)
context = browser.newContext
# Open new page
page = context.newPage
# Go to https://www.baidu.com/
page.goto( "https://www.baidu.com/")
# Fill input[name="wd"]
page.fill( "input[name="wd"]", "AirPython")
# Press Enter
# with page.expect_navigation(url="https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=AirPython&fenlei=256&rsv_pq=a1739d870005eec3&rsv_t=e640wwS33ra1Koivxvy1WyTxyknRwnllWiw4JBqIYd/KUN/WKpWLtL2b2+0&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=21&rsv_sug1=18&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=6199&rsv_sug4=6199"):
withpage.expect_navigation:
page.press( "input[name="wd"]", "Enter")
# Close page
page.close
# ---------------------
context.close
browser.close
withsync_playwright asplaywright:
run(playwright)
3-2 同步
同步的关键字为:sync_playwright
比如,我们依次使用三个浏览器内核打开浏览器,然后百度一下,接着对在搜索界面截图,最后关闭浏览器
fromtime importsleep
fromplaywright importsync_playwright
# 注意:默认是无头模式
withsync_playwright asp:
# 分别对应三个浏览器驱动
forbrowser_type in[p.chromium, p.firefox, p.webkit]:
# 指定为有头模式,方便查看
browser = browser_type.launch(headless= False)
page = browser.newPage
page.goto( 'http://baidu.com')
# 执行一次搜索操作
page.fill( "input[name="wd"]", "AirPython")
withpage.expect_navigation:
page.press( "input[name="wd"]", "Enter")
# 等待页面加载完全
page.waitForSelector( "text=百度热榜")
# 截图
page.screenshot(path= f'example- {browser_type.name}.png')
# 休眠5s
sleep( 5)
# 关闭浏览器
browser.close
需要指出的是, playwright-python 内置的 API 基本上囊括常见的自动化操作
3-3 异步
异步步的关键字为:async_playwright
结合 asyncio,我们同时执行上面的操作
importasyncio
fromplaywright importasync_playwright
# 异步执行
asyncdefmain:
asyncwithasync_playwright asp:
forbrowser_type in[p.chromium, p.firefox, p.webkit]:
# 指定为有头模式,方便查看
browser = awaitbrowser_type.launch(headless= False)
page = awaitbrowser.newPage
awaitpage.goto( 'http://baidu.com')
# 执行一次搜索操作
awaitpage.fill( "input[name="wd"]", "AirPython")
awaitpage.press( "input[name="wd"]", "Enter")
# 等待页面加载完全
awaitpage.waitForSelector( "text=百度热榜")
# 截图
awaitpage.screenshot(path= f'example- {browser_type.name}.png')
awaitbrowser.close
asyncio.get_event_loop.run_until_complete(main)
4. 最后
事实上, Playwright 是一个跨语言的自动化框架,支持 Python、Java、JS 等
如果你觉得文章还不错,请大家点赞、分享、留言下,因为这将是我持续输出更多优质文章的最强动力!
提供300分钟视频讲解,教学大纲、课件、教案、习题答案、程序源码等配套资源。
扫码,优惠购书
凡是在京东购书的用户,可以将订单信息和评价发到itbook8@163.com,将会获取超值大礼包(包括案例源码,超多的视频教程,数据集等资源)
“ 在看”的永远18岁~