Python怎么将pdf转为图片？Python如何实现pdf文件转图片

Rick_M359

已于 2023-03-15 22:51:46 修改

阅读量7.4k

点赞数 2

分类专栏： OCR 文章标签： python Powered by 金山文档

于 2023-03-15 22:47:44 首次发布

本文链接：https://blog.csdn.net/Rick_M/article/details/129572194

版权

OCR 专栏收录该内容

1 篇文章 1 订阅

订阅专栏

而pdf则是用来保存一些内容已经确定好的数据，因为pdf是无法直接修改内容的，所以也会经常将pdf转为图片来保存。本文就将会来介绍一下pdf转图片的方法，往下看看吧。

1.pdf转图片的话主要实现所需要的模块叫做PyMuPDF，它就是用来操作pdf文件的，通过pip工具下载安装即可。除了这个模块之外还需要用到os模块，它是用来读取pdf文件并在转为图片后将其保存起来的，示例如下：

import datetime
import os
import fitz    # 这个就是PyMuPDF模块

2.那么为了保证这个功能能够重复的使用，所以需要用函数将主要实现的代码保存起来。并且函数的参数需要是读取pdf的文件路径和保存图片的文件路径，示例如下：

def pyMuPDF_fitz(pdfPath, imagePath):
    pdfDoc = fitz.open(pdfPath)

3.函数创建好之后并且使用fitz.open()方法打开一个pdf文件生成文件对象，接下来就需要去使用for循环将pdf文件的内容给读取出来。然后在循环之中去设置一下图片的分辨率和dpi等参数，在循环之中实际上是将pdf文件内容写入到一个图片对象中，代码如下：

for pg in range(pdfDoc.pageCount):
    page = pdfDoc[pg]
    rotate = int(0)
    zoom_x = 1.33333333
    zoom_y = 1.33333333
    mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
    pix = page.getPixmap(matrix=mat, alpha=False)

4.图片内容写入并且生成完之后就要使用os模块去判断一下保存图片的文件路径是否存在了，如果不存在则创建一个来保存，示例如下：

if not os.path.exists(imagePath): 
    os.makedirs(imagePath) 
pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)

5.最后在_mian_方法中调用这个函数，这样就可以作为模块去使用了，代码如下：

if __name__ == "__main__":
    pdfPath = 'demo1.pdf'
    imagePath = './imgs'
pyMuPDF_fitz(pdfPath, imagePath)

以上就是关于“Python怎么将pdf转为图片？Python如何实现pdf文件转图片”的全部内容了，希望对你有所帮助。

import datetime
import os
import fitz  # fitz就是pip install PyMuPDF


def pyMuPDF_fitz(pdfPath, imagePath):
    startTime_pdf2img = datetime.datetime.now()  # 开始时间
    print("imagePath=" + imagePath)
    pdfDoc = fitz.open(pdfPath)
    for pg in range(pdfDoc.pageCount):
        page = pdfDoc[pg]
        rotate = int(0)
        # 每个尺寸的缩放系数为1.3，这将为我们生成分辨率提高2.6的图像。
        # 此处若是不做设置，默认图片大小为：792X612, dpi=96
        zoom_x = 1.33333333  # (1.33333333-->1056x816)   (2-->1584x1224)
        zoom_y = 1.33333333
        mat = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
        pix = page.getPixmap(matrix=mat, alpha=False)
        if not os.path.exists(imagePath):  # 判断存放图片的文件夹是否存在
            os.makedirs(imagePath)  # 若图片文件夹不存在就创建
        pix.writePNG(imagePath + '/' + 'images_%s.png' % pg)  # 将图片写入指定的文件夹内
    endTime_pdf2img = datetime.datetime.now()  # 结束时间
    print('pdf2img时间=', (endTime_pdf2img - startTime_pdf2img).seconds)

if __name__ == "__main__":
    # 1、PDF地址
    pdfPath = 'demo1.pdf'
    # 2、需要储存图片的目录
    imagePath = './imgs'
    pyMuPDF_fitz(pdfPath, imagePath)