python之html网页转PDF

最新推荐文章于 2024-04-28 11:35:41 发布

《落神》

最新推荐文章于 2024-04-28 11:35:41 发布

阅读量1.4k

点赞数

分类专栏：爬虫文章标签： html转pdf

本文链接：https://blog.csdn.net/zuo199606184810/article/details/98030134

版权

爬虫专栏收录该内容

37 篇文章 4 订阅

订阅专栏

接上一篇，博主目前所要做的任务，除了要将图片转成pdf外，可能还需要根据爬去站点的内容来合成一篇pdf格式文章，

python中是能够做到这一点的，当然这个前提你要手写html的head，然后将爬取下的内容（注：内容为html样式）作为body的内容。

python中的pdfkit包能够达到这方面的要求，当然前提要下载下来安装好，安装的方法很简单自行百度！

直接上代码：

def content_pdf(item):
    """
    将content内容保存为pdf格式
    :param content:字符串
    :return:
    """
    html = '<html><head><meta charset="UTF-8"></head>' \
           '<body><div align="center"><p>%s</p></div></body></html>' % item['content']
    path_wk = r'C:\soft\wkhtmltopdf\bin\wkhtmltopdf.exe'  # 安装位置
    try:
        out_pdf = file_path(item)
        config = pdfkit.configuration(wkhtmltopdf=path_wk)
        pdfkit.from_string(html, out_pdf.format(item['title']), configuration=config)
        item['download_status'] = 1
        return item
    except Exception as e:
        print(e)

注意：由于爬取内容html的css缺少，所以当前生成的pdf是不美观的。所以说这个就要根据自己的能力来添加样式，达到符合阅读的要求！

《落神》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python之html网页转PDF

接上一篇，博主目前所要做的任务，除了要将图片转成pdf外，可能还需要根据爬去站点的内容来合成一篇pdf格式文章，python中是能够做到这一点的，当然这个前提你要手写html的head，然后将爬取下的内容（注：内容为html样式）作为body的内容。python中的pdfkit包能够达到这方面的要求，当然前提要下载下来安装好，安装的方法很简单自行百度！直接上代码：def cont...
复制链接

扫一扫