牛!playwright 一行命令一键把html网页保存为pdf,太方便了!

前言

今天介绍将HTML网页抓取下来,然后以PDF保存,也可以将自己写好生成的HTML转成PDF。废话不多说直接进入教程。

1. 安装

Conda安装:
conda config --add channels conda-forge
conda config --add channels microsoft
conda install playwright
playwright install
Pip安装:
# 安装playwright
pip install playwright
# 安装browser驱动
playwright install

2. 利用playwright 将page保存为pdf格式的用法

playwright pdf html文件路径 PDF输出路径
playwright pdf ./baidu.html ./baidu.pdf
  • –viewport-size选项生成不同大小的窗口
    playwright pdf --viewport-size=800,600 ./baidu.html ./baidu.pdf
    
  • 模拟地理位置、语言和时区
    playwright pdf --timezone="Asia/Shanghai" --geolocation="30.890221,120.492348" --lang="zh-CN" ./baidu.html ./baidu.pdf
    

3. Python playwright将网页批量保存pdf文件

from playwright.sync_api import sync_playwright

# 获取要保存的 URL 列表
urls = []
with open('urls.txt', mode='rt', encoding='utf-8') as f:
    urls = f.readlines()

# 访问目标 URL 列表并另存为 PDF
with sync_playwright() as p:
    browser = p.chromium.launch()
    for i,url in enumerate(urls):
        context = browser.new_context()
        page = context.new_page()
        page.goto(url)
        page.pdf(path=f"{i}.pdf")
    browser.close()
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于使用 Playwright保存 cookie,你可以按照以下步骤进行操作: 1. 首先,你需要在你的代码中导入 Playwright 的库。例如,如果你使用的是 Python,可以使用以下代码导入 Playwright 的库: ```python from playwright.sync_api import sync_playwright ``` 2. 接下来,你需要启动一个浏览器实例。可以使用以下代码来启动一个 Chromium 浏览器实例: ```python with sync_playwright() as playwright: browser = playwright.chromium.launch() context = browser.new_context() page = context.new_page() ``` 3. 然后,你可以访问网页并进行登录或其他操作,以便设置 cookie。 4. 一旦你完成了登录或其他操作,你可以使用 `context.cookies()` 方法获取当前页面的所有 cookie。例如,你可以使用以下代码获取当前页面的 cookie: ```python cookies = context.cookies() ``` 5. 最后,你可以将 cookie 保存到文件中以备将来使用。例如,你可以使用以下代码将 cookie 保存到名为 "cookies.json" 的文件中: ```python import json with open("cookies.json", "w") as file: json.dump(cookies, file) ``` 这样,你就成功保存了 cookie。下次你可以加载这个文件,并使用 `context.add_cookies()` 方法将 cookie 添加到页面中,以便自动登录或完成其他操作。 请注意,这只是一个简单的示例,具体的实现可能会因为你的具体需求而有所不同。你可以根据自己的情况进行调整和扩展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值