python批量转化pdf图片为jpg图片

1.把pdf图片批量转为jpg;需要注意的是,需要先安装poppler这个软件,具体安装教程放在下面代码中了
2.代码

#poppler安装教程参考:https://blog.csdn.net/wy01415/article/details/110257130
#windows上poppler下载链接:https://github.com/oschwartz10612/poppler-windows
from pdf2image import convert_from_path
from PIL import Image
import os


def convert_pdf_to_jpg(pdf_folder, output_folder, poppler_path):
    for pdf_file in os.listdir(pdf_folder):
        if pdf_file.endswith('.pdf'):
            pdf_path = os.path.join(pdf_folder, pdf_file)
            images = convert_from_path(pdf_path, poppler_path=poppler_path)

            for i, image in enumerate(images):
                #如果pdf有多页用下面这个代码
                # output_filename = f"{os.path.splitext(pdf_file)[0]}_page_{i + 1}.jpg"
                # 如果pdf就1页用下面这个代码
                output_filename = f"{os.path.splitext(pdf_file)[0]}.jpg"
                output_path = os.path.join(output_folder, output_filename)

                image.save(output_path, 'JPEG')


pdf_folder = 'E:/pythonworking/file/pdf_merge/workspace'
output_folder = 'E:/pythonworking/file/pdf_merge/workspace'
poppler_path = 'D:/software/Poppler/Release-24.02.0-0/poppler-24.02.0/Library/bin'

convert_pdf_to_jpg(pdf_folder, output_folder, poppler_path)

3.输出结果:在这里插入图片描述

  • 7
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是一个简单的Python程序,可以使用PyPDF2库将PDF文件批量转换为图片。 ```python import os from io import BytesIO from PIL import Image import PyPDF2 # 设置PDF文件夹路径和图片文件夹路径 pdf_dir = 'path/to/pdf/files' img_dir = 'path/to/image/files' # 获取PDF文件夹中的所有PDF文件 pdf_files = [f for f in os.listdir(pdf_dir) if f.endswith('.pdf')] # 遍历PDF文件列表 for pdf_file in pdf_files: # 打开PDF文件 with open(os.path.join(pdf_dir, pdf_file), 'rb') as f: pdf_reader = PyPDF2.PdfFileReader(f) # 获取PDF文件页数 num_pages = pdf_reader.numPages # 遍历PDF文件的所有页 for page_num in range(num_pages): # 提取PDF文件的当前页并将其转换为PIL图像 page = pdf_reader.getPage(page_num) img = page.toImage() img_bytes = BytesIO(img.getData()) img_pil = Image.open(img_bytes) # 保存图像文件 img_file = f"{pdf_file[:-4]}_{page_num+1}.jpg" img_path = os.path.join(img_dir, img_file) img_pil.save(img_path) ``` 说明: - 首先,我们需要设置PDF文件夹路径和图片文件夹路径。 - 然后,我们获取PDF文件夹中的所有PDF文件。 - 接着,我们遍历PDF文件列表,打开每个PDF文件,获取其页数,并遍历其所有页。 - 对于每一页,我们使用`PyPDF2.PdfFileReader`库提取该页,并将其转换为PIL图像。 - 最后,我们将图像保存为JPEG文件,并使用文件名和页数对其进行命名。 请注意,此程序需要安装`PyPDF2`和`Pillow`库。您可以使用以下命令安装这些库: ``` pip install PyPDF2 Pillow ``` 希望这可以帮助您!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值