牛！playwright 一行命令一键把html网页保存为pdf，太方便了！

最新推荐文章于 2025-05-08 07:52:43 发布

爱python的王三金

最新推荐文章于 2025-05-08 07:52:43 发布

阅读量2k

点赞数 1

分类专栏：小程序文章标签： html pdf 前端 python 用户运营

本文链接：https://blog.csdn.net/qq_37275405/article/details/133851501

版权

小程序专栏收录该内容

6 篇文章

订阅专栏

前言

今天介绍将HTML网页抓取下来，然后以PDF保存，也可以将自己写好生成的HTML转成PDF。废话不多说直接进入教程。

1. 安装

Conda安装:

conda config --add channels conda-forge
conda config --add channels microsoft
conda install playwright
playwright install

Pip安装：

# 安装playwright
pip install playwright
# 安装browser驱动
playwright install

2. 利用playwright 将page保存为pdf格式的用法

playwright pdf html文件路径 PDF输出路径

playwright pdf ./baidu.html ./baidu.pdf

–viewport-size选项生成不同大小的窗口

playwright pdf --viewport-size=800,600 ./baidu.html ./baidu.pdf

模拟地理位置、语言和时区

playwright pdf --timezone="Asia/Shanghai" --geolocation="30.890221,120.492348" --lang="zh-CN" ./baidu.html ./baidu.pdf

3. Python playwright将网页批量保存pdf文件

from playwright.sync_api import sync_playwright

# 获取要保存的 URL 列表
urls = []
with open('urls.txt', mode='rt', encoding='utf-8') as f:
    urls = f.readlines()

# 访问目标 URL 列表并另存为 PDF
with sync_playwright() as p:
    browser = p.chromium.launch()
    for i,url in enumerate(urls):
        context = browser.new_context()
        page = context.new_page()
        page.goto(url)
        page.pdf(path=f"{i}.pdf")
    browser.close()