python下载网页中的pdf文件_揭秘!Python如何将网站导出为PDF

很多公众号提供功能,可以将你需要的公众号内容变为PDF,方便阅读和收藏,用着挺方便,微信的文章为PDF,网站内容导出为PDF,这些是如何做到的?python有这样的支持库吗?能不能也用Python来开发呢?

42166d224f4a20a4132bf61a73639b27730ed0e9.jpeg?token=ec3dbaabe5fa46a10e3afa771c8585cb&s=A502D61242226EB405A743E90300B023Python如何将网站导出为PDF

下面为你揭秘:从安装到应用,都一一详细的讲解到,如果你能跟着一起动手学习,相信也能开发出属于自己的一款强大PDF转化工具出来。

f2deb48f8c5494ee8b6509facec4e3fb98257e40.jpeg?token=01c3771adb6a86940dc7386232f375d7&s=5C00EE1F0B0176D448B7C8EB0300E028

现在隆重介绍,Python-PDFKit:转化HTML成PDF利器!这个Python库基于wkhtmltopdf应用程序包,并提供了Python 2和3封装,兼容2种不同版本的Python。该库基于Webkit将HTML转换为PDF。

安装:

首先需要安装基础框架wkhtmltopdf:

安装wkhtmltopdf:于Debian / Ubuntu:$ sudo apt-get install wkhtmltopdf

苹果MAC系统:$ brew install caskroom / cask / wkhtmltopdf

警告!debian / ubuntu repos中的版本减少了功能(因为它编译时没有使用wkhtmltopdf QT补丁),例如添加轮廓,页眉,页脚,TOC等。要使用此选项,应该从wkhtmltopdf站点下载安装静态二进制文件。

Windows和其他选项:打开wkhtmltopdf 项目网站,下载安装二进制安装程序。完毕,就可以安装python-pdfkit了。

安装python-pdfkit:$ pip install pdfkit(或python3采用pip3 )

用法:

快速入门,把一个网页链接,一个静态网页等转成pdf。

63d0f703918fa0ecfca404f0c5a65aeb3c6ddba7.jpeg?token=dd26246dbbb0fb923b188ffa7c68d406&s=C0151D748D27790B4C7D48CA0300E0B2

import pdfkitpdfkit.from_url(' web link ',' out.pdf ')pdfkit.from_file(' test.html ',' out.pdf ')pdfkit.from_string(' Hello!',' out.pdf ')

来个更好玩的,如果要多个页面合成一个pdf,该咋办?给你5秒钟。

好了,答案如下:

pdfkit.from_url([ ' web1 ',' weburl2 ',' weburl3 ' ],' out.pdf ')pdfkit.from_file([ 'file1.html ',' file2.html ' ],' out.pdf ')

把一个网页转成PDF也可以这么用:

with open(' file.html ')as f: pdfkit.from_file(f,' out.pdf ')

这样,pdfkit就能完成基本的转pdf任务了。

如果,要把若干HTML页面转成一个pdf,并且定义封面和章节的链接,甚至文档样式css,怎么做呢?

toc = { ' xsl-style-sheet ':' toc.xsl '}cover = ' cover.html 'pdfkit.from_file(' file.html ',options = options,toc = toc,cover = cover)pdfkit.from_file(' file.html ',options = options,toc = toc,cover = cover,cover_first = True)

常见错误及解法:

IOError: 'No wkhtmltopdf executable found':确保您的$ PATH中有wkhtmltopdf或通过自定义配置设置。Windows 中的wkhtmltopdf或Linux 上的wkhtmltopdf应返回二进制的实际路径。IOError: 'Command Failed'此错误表示PDFKit无法处理输入。您可以尝试直接从错误消息运行命令,并查看导致失败的错误(在某些wkhtmltopdf版本上,这可能是由于分段错误导致的)经过上面的介绍,相信聪明的你,已经掌握了从HTML转PDF的利器,pdfkit的使用方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值