如何使用Puppeteer + Chrome将网页,博客批量导出成PDF?(一)

本文介绍了如何使用Puppeteer库结合Chrome将网页内容批量导出为PDF,包括整体网页和选中部分内容的PDF生成,并通过添加CSS实现广告等无关内容的隐藏,从而提高PDF的阅读体验。
摘要由CSDN通过智能技术生成

背景

前端时间公司出台新规定,上班时间禁止浏览与“工作无关”的网页。当然这个有没有关不是自己定的而是公司定的,其中就包含各种技术论坛。

什么?你说你可以偷偷上让老板发现不了?只能说你too young too simple。

最保险的办法不是偷偷上不让老板发现,也不是通过各种牛逼手段绕过监控。那是啥呢?就是真的不上。作为一个高龄程序员,知道有些红线是不能碰的。别问我为啥知道~~

但是在公司查看各种离线文档,PDF啥都是没有问题的,毕竟为了工作我也得时刻保持学习。要不然不等后浪,自己就先晒死在沙滩上了。

既然PDF离线文档都没有问题,哈哈哈:有了(程序员的快乐就这么简单)。

目录

背景

Puppeteer简介

手动生成PDF

生成整个网页

 仅生成选中部分

初步使用Puppeteer

基本思路

调用PDF的API

把选中的内容生成PDF

总结


Puppeteer简介

前段时间正好学了一下Puppeteer 知道他可以把网页导出成PDF,准确的说是Chrome可以。OK, 那么什么是Puppeteer ?

Puppeteer 是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome。Puppeteer 默认以 headless 模式运行,但是可以通过修改配置文件运行“有头”模式。

没错,Puppeteer就是一个Node库,包装了对Chrome的各种控制。这里就不深入展开讨论。想继续深入学习Puppeteer的同学传送门在这里>puppeteer<.

手动生成PDF

生成整个网页

打开任何一篇CSDN文章,比如:PowerShell:如何一行代码(脚本)刷抖音快手视频?老司机教你如何薅羊毛(二)【多线程版】_火星蛙的博客-CSDN博客

然后点击 右键,选择打印

 然后会弹出打印预览页面,但是出来的预览页面让我很不满意,左边的广告栏把正文的内容都挤跑了。这样生成的PDF拿到公司也没法看啊。

 效果让人很不满意,而且我想要的内容只是,文章的正文。

 仅生成选中部分

既然整个网页导出成PDF有问题,那么部分网页呢?或者说只是选中的部分呢?

再次调出打印预览页面,在“

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT大厨

技术人,都不易,谢谢大大赏赐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值