import sys, fitz, os, datetime
import time
from PIL import Image
import numpy as np
import tabula
'''
fitz库是什么,它是pymupdf中的一个模块,操作PDF非常舒服,只需要pip安装即可:
pip install pymupdf
'''
def pyMuPDF_fitz(pdfPath, imagePath, zoomNum):
startTime_pdf2img = datetime.datetime.now()#开始时间
print("imagePath="+imagePath)
pdfDoc = fitz.open(pdfPath)
for pg in range(pdfDoc.pageCount):
page = pdfDoc[pg]
rotate = int(0)
# 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。
# 此处若是不做设置,默认图片大小为:792X612, dpi=96
# zoom_x = 1.33333333 #(1.33333333-->1056x816) (2-->1584x1224)
zoom_x = zoomNum #(1.33333333-->1056x816) (2-->1584x1224)
# zoom_y = 1.33333333
zoom_y = zoomNum
mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
pix = page.getPixmap(matrix=mat, alpha=False)
if not os.path.exists(imagePath):#判断存放图片的文件夹是否存在
os.makedirs(imagePath) # 若图片文件夹不存在就创建
if pg < 10:
pg_str = '00' + str(pg)
elif 10 <= pg <100:
pg_str = '0' + str(pg)
else:
pg_str = str(pg)
pix.writePNG(imagePath+'/'+'%s.png' % pg_str)#将图片写入指定的文件夹内
endTime_pdf2img = datetime.datetime.now()#结束时间
python去除PDF中印章
最新推荐文章于 2024-05-15 23:18:40 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)