python将pdf中的每一页转化为图片保存

最新推荐文章于 2024-04-25 10:24:24 发布

来自python的小小白

最新推荐文章于 2024-04-25 10:24:24 发布

阅读量2.3k

点赞数 1

分类专栏： python pdf image 文章标签： python 密码学 mupdf

本文链接：https://blog.csdn.net/yibing1996/article/details/107841410

版权

python 同时被 3 个专栏收录

4 篇文章 2 订阅

订阅专栏

pdf

1 篇文章 0 订阅

订阅专栏

image

1 篇文章 0 订阅

订阅专栏

有的pdf可能是加密的，但是没有密码，提供一个解密的方案。

import PyPDF4
import pikepdf
import fitz

def jiemi(pdfpath):

    new_pdfpath = pdfpath[:-4] + '_new' + pdfpath[-4:]

    fp = open(pdfpath, "rb+")
    pdfFile = PyPDF4.pdf.PdfFileReader(fp)

    # pdf 解密
    if pdfFile.isEncrypted:
        pdf = pikepdf.open(pdfpath, password='')
        pdf.save(new_pdfpath)
    return new_pdfpath

将pdf中的每一页保存为图片

def pdf_image(pdf_name):
    img_paths = []
    pdf = fitz.Document(pdf_name)
    for i,pg in enumerate(range(0, pdf.pageCount)):
        page = pdf[pg]  # 获得每一页的对象
        trans = fitz.Matrix(3.0, 3.0).preRotate(0)
        pm = page.getPixmap(matrix=trans, alpha=False)  # 获得每一页的流对象
        # pm.writePNG(dir_name + os.sep + base_name[:-4] + '_' + '{:0>3d}.png'.format(pg + 1))  # 保存图片
        img_path = pdf_name[:-4] + '_' + str(pg+1) + '.jpg'
        pm.writePNG(img_path)  # 保存图片
        img_paths.append(img_path)
    pdf.close()
    return img_paths

来自python的小小白

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
python将pdf中的每一页转化为图片保存

有的pdf可能是加密的，但是没有密码，提供一个解密的方案。import PyPDF4import pikepdfimport fitzdef jiemi(pdfpath): new_pdfpath = pdfpath[:-4] + '_new' + pdfpath[-4:] fp = open(pdfpath, "rb+") pdfFile = PyPDF4.pdf.PdfFileReader(fp) # pdf 解密 if pdfFile.isE
复制链接

扫一扫