前言
在我们的日常工作中,经常会遇到文件下载的事件,如下图:
我们可以看到在下载文件时会弹出一个Windows对话框,我们知道,selenium只能操作web页面,无法操作Windows对话框,使用selenium时,我们可以借助autoit等工具实现该功能。
playwright则可以不借助其他工具实现文件的下载。
文件下载
playwright提供了expect_download()操作来实现文件的下载操作,当浏览器上下文关闭时,所有属于浏览器上下文的下载文件都会被删除。
下载开始后会发出下载事件。下载完成后,下载路径可用:
with page.expect_download() as download_info:
page.get_by_text("Download file").click()
download = download_info.value
# wait for download to complete
path = download.path()
相关操作
- 取消下载
如果下载已经完成或取消,则不会失败。成功取消后,download.failure()将解析为’canceled’
download.cancel()
- .删除下载的文件
download.delete()
- 返回下载错误(如果有)
download.failure()
- 获取下载所属的页面
download.page
- 下载路径
下载成功,则返回下载文件的路径。如有必要,该方法将等待下载完成。该方法在远程连接时抛出。
download.path()
注:下载的文件名是随机 GUID,使用download.suggested_filename获取建议的文件名
- 将下载复制到用户指定的路径。在下载仍在进行时调用此方法是安全的。如有必要,将等待下载完成。
download.save_as(path)
- 返回此下载的建议文件名
download.suggested_filename
注:通常由浏览器根据Content-Disposition响应标头或download属性计算得出
- 返回下载的 url
download.url
实例
我们以下载我们常用的Python单元测试框架pytest为例,使用playwright的代码如下:
from playwright.sync_api import sync_playwright
def run(playwright):
browser = playwright.chromium.launch(headless=False)
context = browser.new_context(accept_downloads=True)
# Open new page
page = context.new_page()
page.goto("https://pypi.org/project/pytest/#files")
# 点击要下载的文件按钮
with page.expect_download() as download_info:
page.click("text=pytest-7.3.1.tar.gz")
download = download_info.value
path = download.path()
download.save_as(path)
# 打印保存路径
print(path)
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright)
运行脚本,结果如下,我们可以看到,我们正在下载pytest的压缩文件。
总结
本文主要介绍了使用playwright实现自动化的文件下载,相比于selenium,playwright文件下载的功能更加强大,不需要借助其他工具就能够实现。