学习工作中,可能碰到需要将多个pdf文件转换为图片的情况,如果是一个pdf,可以用福新、Adobe acrobat等软件进行转换,如果有多个pdf文件,这些软件可能就显得力不从心。下面介绍使用Python的fitz模块进行批量转换:
- 安装fitz模块
pip install fitz PyMuPDF
- 完整代码:
# ************************************************************************
# _*_coding:utf-8_*_
# Author: Pandas120 (微信)
# Desription: 批量将同一文件夹内的pdf文件转换为图片
# ************************************************************************
import fitz
import os,glob
def convert_page_pic(pdf_path,img_path):
with fitz.open(pdf_path) as pdf:
for pg in range(0, pdf.page_count):
page = pdf[pg]
# 设置缩放和旋转系数,zoom_x, zoom_y取相同值,表示等比例缩放
mat = fitz.Matrix(2, 2)
pm = page.get_pixmap(matrix=mat, alpha=False)
if pm.width > 2000 or pm.height > 2000:
pm = page.get_pixmap(matrix=fitz.Matrix(1, 1), alpha=False)
page_num = pg + 1
pm.save('{0}/{1:0>4}.png'.format(img_path,page_num))
if __name__=="__main__":
#输入参数
pdf_folder = 'pdf' #pdf路径文件夹,最后不要带斜杠
out_path = 'out_img' #输出图片路径文件夹,最后不要带斜杠
#输入参数
if not os.path.exists(out_path):
os.mkdir(out_path)
pdfs = glob.glob(f"{pdf_folder}/*.pdf")
for pdf_paths in pdfs:
filename = os.path.split(pdf_paths)[1].replace('.pdf','')
out_path_final = f"{out_path}/{filename}"
if not os.path.exists(out_path_final):
os.mkdir(out_path_final)
convert_page_pic(pdf_paths,out_path_final)