牛!playwright 一行命令一键把html网页保存为pdf,太方便了!

前言

今天介绍将HTML网页抓取下来,然后以PDF保存,也可以将自己写好生成的HTML转成PDF。废话不多说直接进入教程。

1. 安装

Conda安装:
conda config --add channels conda-forge
conda config --add channels microsoft
conda install playwright
playwright install
Pip安装:
# 安装playwright
pip install playwright
# 安装browser驱动
playwright install

2. 利用playwright 将page保存为pdf格式的用法

playwright pdf html文件路径 PDF输出路径
playwright pdf ./baidu.html ./baidu.pdf
  • –viewport-size选项生成不同大小的窗口
    playwright pdf --viewport-size=800,600 ./baidu.html ./baidu.pdf
    
  • 模拟地理位置、语言和时区
    playwright pdf --timezone="Asia/Shanghai" --geolocation="30.890221,120.492348" --lang="zh-CN" ./baidu.html ./baidu.pdf
    

3. Python playwright将网页批量保存pdf文件

from playwright.sync_api import sync_playwright

# 获取要保存的 URL 列表
urls = []
with open('urls.txt', mode='rt', encoding='utf-8') as f:
    urls = f.readlines()

# 访问目标 URL 列表并另存为 PDF
with sync_playwright() as p:
    browser = p.chromium.launch()
    for i,url in enumerate(urls):
        context = browser.new_context()
        page = context.new_page()
        page.goto(url)
        page.pdf(path=f"{i}.pdf")
    browser.close()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱python的王三金

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值