强烈推荐这款神器,一行命令将网页转PDF!

7209e1631f4cbc7629fdc440216892e0.png

文 | 闲欢

来源:Python 技术「ID: pythonall」

7405379660cedd51db3062a71277f13a.png

在日常工作生活中,我们常常会遇到一个需求:将网页保存为PDF。

比如,我比较喜欢某个公众号的文章,为了防止文章被删除,我想把这个公众号的历史文章保存为 PDF 文件,放到本地硬盘里,随时可以拿出来看。

我之前使用的方法是浏览器自带的功能,使用快捷键 Ctrl + P 或者在浏览器上右键点击页面,然后选择“打印”选项 ,调出浏览器打印功能。

9fbc59929f11828374e4168fa80f8bbc.png

接着在“打印机”选项中选择“另存为PDF”,就可以输出 PDF 文件了。

这一套流程耗时有点长,偶尔操作个别页面是可以的,如果页面多了之后就会比较焦躁。

今天无意中发现一个好用的工具,它只需要一行命令就可以实现网页转 PDF 文件保存。

这款神器就是——wkhtmltopdf!

安装

要使用 wkhtmltopdf ,需要先安装这个软件。

wkhtmltopdf 的官网地址是:https://wkhtmltopdf.org/

在官网的 Downloads 导航下,我们可以看到这款软件支持多种操作系统,选择你正在使用的操作系统对应的安装文件即可。

0a69237c8b208172fe411d3eea046269.png

我这里下载的是 windows 版本,下载完成之后,直接安装。安装过程比较简单,总共才几步,直接默认配置即可。

使用

网页转 PDF

软件安装完成之后,就可以使用了。

这里以百度首页为例,展示如何将百度首页保存为 PDF 文件。

我们打开终端,找到安装路径下的 bin 目录,我的电脑路径是这样的:

bf53b7f026d1aa3a0c0931fa15fdd204.png

然后输入命令:

.\wkhtmltopdf.exe  https://baidu.com C:\baidu.pdf

运行这个命令,等待运行完成后,你就可以在指定的目录下找到 baidu.pdf 文件了,我这里是 C 盘根目录下。

18c5685da52b14dc44318a9f0a6d3c4f.png


这里不限于网站上的网页,本地的 html 文件也是可以的,你只需要把 https://baidu.com 替换成你本地的网页路径就行。

这里,需要进入到软件的安装目录下才可以运行命令,比较麻烦。你可以将软件的 bin 目录添加到环境变量中,添加完成后就可以在终端中即开即用了。

网页转图片

wkhtmltopdf 不仅可以将网页转 PDF 文件保存,还可以将网页转为图片保存,只需要使用另一个命令即可:

.\wkhtmltoimage.exe  https://baidu.com C:\baidu.png

同样地,等待命令运行完毕,你就可以在对应目录下找到 baidu.png 的图片了。

cd6a3b356d5654431249e9e5e4eaacd0.png

总结

wkhtmltopdf 的使用非常简单,甚至于官网对其使用方法也是几句话介绍。基于这个工具,我们也许可以做更多的事情,比如调用这个脚本命令,批量将爬虫爬取下来的网页转为 PDF 或者图片保存,这个有待各位去探索和使用!

PS:公号内回复「Python」即可进入Python 新手学习交流群,一起 100 天计划!

老规矩,兄弟们还记得么,右下角的 “在看” 点一下,如果感觉文章内容不错的话,记得分享朋友圈让更多的人知道!

802d9973526b941014d83fd97c146848.gif

神秘礼包获取方式

识别文末二维码,回复:1024

fd48c0932b9c09b76d972678e9be89f9.png

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值