背景
前端时间公司出台新规定,上班时间禁止浏览与“工作无关”的网页。当然这个有没有关不是自己定的而是公司定的,其中就包含各种技术论坛。
什么?你说你可以偷偷上让老板发现不了?只能说你too young too simple。
最保险的办法不是偷偷上不让老板发现,也不是通过各种牛逼手段绕过监控。那是啥呢?就是真的不上。作为一个高龄程序员,知道有些红线是不能碰的。别问我为啥知道~~
但是在公司查看各种离线文档,PDF啥都是没有问题的,毕竟为了工作我也得时刻保持学习。要不然不等后浪,自己就先晒死在沙滩上了。
既然PDF离线文档都没有问题,哈哈哈:有了(程序员的快乐就这么简单)。
目录
Puppeteer简介
前段时间正好学了一下Puppeteer 知道他可以把网页导出成PDF,准确的说是Chrome可以。OK, 那么什么是Puppeteer ?
Puppeteer 是一个 Node 库,它提供了一个高级 API 来通过 DevTools 协议控制 Chromium 或 Chrome。Puppeteer 默认以 headless 模式运行,但是可以通过修改配置文件运行“有头”模式。
没错,Puppeteer就是一个Node库,包装了对Chrome的各种控制。这里就不深入展开讨论。想继续深入学习Puppeteer的同学传送门在这里>puppeteer<.
手动生成PDF
生成整个网页
打开任何一篇CSDN文章,比如:PowerShell:如何一行代码(脚本)刷抖音快手视频?老司机教你如何薅羊毛(二)【多线程版】_火星蛙的博客-CSDN博客
然后点击 右键,选择打印
然后会弹出打印预览页面,但是出来的预览页面让我很不满意,左边的广告栏把正文的内容都挤跑了。这样生成的PDF拿到公司也没法看啊。
效果让人很不满意,而且我想要的内容只是,文章的正文。
仅生成选中部分
既然整个网页导出成PDF有问题,那么部分网页呢?或者说只是选中的部分呢?
再次调出打印预览页面,在“