记一次将使用python将html转pdf的辛酸史

项目中需要将HTML页面转换为PDF并切分成图片,由于页面使用AJAX加载和Echarts图表,常规方法失效。通过selenium加载页面,截取Echarts图表,替换为截图,再利用pdfkit、pdf2image等工具生成PDF并切图,详细步骤和所需工具一并介绍。
摘要由CSDN通过智能技术生成

项目需求要将页面生成pdf,然后把每页切分成图片...本想着这事轻车熟路挺简单的,而且网上很多相关博客。

话不多说直接干!咔咔咔,一顿操作页面生成了,但是有个大坑,整个页面所有内容都是ajax加载数据渲染的并且存在echarts图表。

经历自己熟悉的方法和各种博客上记录方法失败后,各种检索无果后,只能另辟蹊径了。(建议:还是先采用正常套路来生成pdf,实在没办法,这个方法可以做一个参考)。

需要使用的模块:selenium、pdfkit、pdf2image、pillow、wkhtmltopdf

需要使用的工具:wkhtmltox、poppler、chromedriver(工具需要下载安装,具体怎么下载安装请百度)

简单介绍下思路:

1、采用selenium请求页面,等待页面全部加载完成,定位到的echarts图表进行截图,然后将该区域内容替换成截图;

2、替换完成后,获取页面全部内容,写入到html文件;

3、采用pdfkit将刚刚的html文件转成pdf(这时间需要配置允许加载本地文件);

4、采用pdf2image将pdf文件按页切分为图片

下面直接上干货:

import os
import shutil
import time
from os.path import split

import pdfkit
from pdf2image import convert_from_path

from DaXing import settings
from PIL import Image
from selenium import
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值