Python 几行代码把PDF转为图片

最新推荐文章于 2024-05-21 17:38:02 发布

转身成为了码农

最新推荐文章于 2024-05-21 17:38:02 发布

阅读量620

点赞数 18

文章标签： python pdf 开发语言

本文链接：https://blog.csdn.net/alphonse_10/article/details/136065653

版权

在Python中将PDF转换为图片，可以使用PyMuPDF或pdfplumber这两个库。下面是一个使用PyMuPDF的例子：

import fitz  # 这是 PyMuPDF 的别名，通过 pip install PyMuPDF 安装
from PIL import Image

def convert_pdf_to_images(pdf_path, output_folder):
    doc = fitz.open(pdf_path)

    for page_num in range(doc.page_count):
        page = doc[page_num]
        pix = page.get_pixmap()  # 获取页面的像素图像

        # 保存图片
        img_filename = f"{output_folder}/page_{page_num + 1}.png"
        pix.save(img_filename)

    doc.close()

# 使用示例
convert_pdf_to_images("input.pdf", "output_images")

如果要使用pdfplumber库进行转换，虽然它主要用于读取和分析PDF内容，但也可以实现类似的功能：

import pdfplumber
from PIL import Image

def pdf_to_images(pdf_path, output_folder):
    with pdfplumber.open(pdf_path) as pdf:
        for page_num, page in enumerate(pdf.pages):
            image = page.to_image()
            img_data = image.rgb_matrix

            img = Image.fromarray(img_data)
            img.save(f"{output_folder}/page_{page_num + 1}.jpg", "JPEG")

# 使用示例
pdf_to_images("input.pdf", "output_images")

请确保已安装所需的库：

pip install PyMuPDF Pillow
pip install pdfplumber

注意：pdfplumber的转换可能不如PyMuPDF高效且生成的图片质量可能有所不同，因为它主要是为了文本和布局解析而设计的。对于大规模高质量的图片转换，PyMuPDF通常是更优的选择。

转身成为了码农

关注

18
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Python 几行代码把PDF转为图片

高效且生成的图片质量可能有所不同，因为它主要是为了文本和布局解析而设计的。对于大规模高质量的图片转换，在Python中将PDF转换为图片，可以使用。
复制链接

扫一扫