python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image

最新推荐文章于 2024-05-21 09:48:10 发布

weixin_39710288

最新推荐文章于 2024-05-21 09:48:10 发布

阅读量1.1k

点赞数

文章标签： python pdf转图片 poppler

本文介绍了如何使用Python的PyMuPDF和pdf2image库将PDF转换为PNG图片，包括指定区域截图。PyMuPDF转换速度快，支持按需截取页面部分，而pdf2image是通过poppler工具进行转换。对于大量PDF转换，PyMuPDF性能更优。

摘要由CSDN通过智能技术生成

前言：在最近的测试中遇到一个与PDF相关的测试需求，其中有一个过程是将PDF转换成图片，然后对图片进行测试。

粗略的试了好几种方式，其中语言尝试了Python和Java，总体而言所找到的Python方式相对比Java更快一些，更简单一些。

下面首先分享一下Python将PDF转换成图片，Java后续有时间在进行分享。

需求：我需要先将PDF转换成为PNG图片，并截取图片的一部分存储，然后作为测试目标进行测试。

操作：

1、PDF转PNG图片

2、对PNG图片进行指定区域截图，在另存到指定文件夹下

1、PyMuPDF将PDF转换成图片

import sys, fitzimport osimport datetimedef pyMuPDF_fitz(pdfPath, imagePath):startTime_pdf2img = datetime.datetime.now()#开始时间print("imagePath="+imagePath)pdfDoc = fitz.open(pdfPath)for pg in range(pdfDoc.pageCount):page = pdfDoc[pg]rotate = int(0)# 每个尺寸的缩放系数为1.3，这将为我们生成分辨率提高2.6的图像。# 此处若是不做设置，默认图片大小为：792X612, dpi=96zoom_x = 1.33333333 #(1.33333333-->1056x816) (2-->1584x1224)zoom_y = 1.33333333mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pix = page.getPixmap(matrix=mat, alpha=False)if not os.path.exists(imagePath):#判断存放图片的文件夹是否存在os.makedirs(imagePath) # 若图片文件夹不存在就创建pix.writePNG(imagePath+'/'+'images_%s.png' % pg)#将图片写入指定的文件夹内endTime_pdf2img = datetime.datetime.now()#结束时间print('pdf2img时间=',(endTime_pdf2img - startTime_pdf2img).seconds)if __name__ == "__main__":pdfPath = '../path/demo.pdf'imagePath = '../path/image'pyMuPDF_fitz(pdfPath, imagePath)

PDF文档页数超过100页的话需要十几秒，因为先转换成一整张1056X816的图片，再对本地文件中的所有图片进行遍历截图，时间上比较慢,通过查看文档发现：

还可以在转换的同时指定图片的大小，对图片指定区域进行截取，这样快很多

最低0.47元/天解锁文章

weixin_39710288

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python pdf转图片 poppler_Python将PDF转成图片—PyMuPDF和pdf2image

前言：在最近的测试中遇到一个与PDF相关的测试需求，其中有一个过程是将PDF转换成图片，然后对图片进行测试。粗略的试了好几种方式，其中语言尝试了Python和Java，总体而言所找到的Python方式相对比Java更快一些，更简单一些。下面首先分享一下Python将PDF转换成图片，Java后续有时间在进行分享。需求：我需要先将PDF转换成为PNG图片，并截取图片的一部分存储，然后作为测试目标进...
复制链接

扫一扫