python pdf2image库使用

第一步安装pdf2image

pip install pdf2image

官网

https://pypi.org/project/pdf2image/

Windows:需要下载poppler ,

下载链接

https://github.com/oschwartz10612/poppler-windows/releases/

mac:

brew install poppler

用法

import pdf2image
from pdf2image import convert_from_path

f_name = "11.pdf"

convert_from_path(
    pdf_path=f_name,  # 要转换的pdf的路径
    dpi=200,  # dpi中的图像质量(默认200)
    output_folder='./Musics',  # 将生成的图像写入文件夹(而不是直接写入内存)#注意中文名的目录可能会出问题
    first_page=1,  # 要处理的第一页
    last_page=1,  # 停止前要处理的最后一页
    fmt="png",  # 输出图像格式
    jpegopt=None,  # jpeg选项“quality”、“progressive”和“optimize”(仅适用于jpeg格式)
    thread_count=4,  # 允许生成多少线程进行处理
    userpw=None,  # PDF密码
    use_cropbox=False,  # 使用cropbox而不是mediabox
    strict=False,  # 当抛出语法错误时,它将作为异常引发
    transparent=False,  # 以透明背景而不是白色背景输出。
    single_file=False,  # 使用pdftoppm/pdftocairo中的-singlefile选项
    poppler_path="D:/codegithub/poppler-23.01.0/Library/bin",  # 查找poppler二进制文件的路径
    grayscale=False,  # 输出灰度图像
    size=None,  # 结果图像的大小,使用枕头(宽度、高度)标准
    paths_only=False,  # 不加载图像,而是返回路径(需要output_文件夹)
    use_pdftocairo=False,  # 用pdftocairo而不是pdftoppm,可能有助于提高性能
    timeout=None,  # 超时
)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Pythonpdf2image是一个用于将PDF文件转换为图像文件的工具。它基于Poppler工具,可以将PDF文件中的每个页面转换为一个单独的图像文件,支持转换为多种图像格式,如JPEG、PNG等。 使用pdf2image非常简单。首先,需要确保已经安装了Poppler工具。然后,在Python中安装pdf2image,可以使用pip命令进行安装。 安装完成后,就可以开始使用pdf2image了。首先,需要导入相关的模块: ``` from pdf2image import convert_from_path, convert_from_bytes ``` 转换PDF文件为图像文件有两个主要的方法:`convert_from_path`和`convert_from_bytes`。`convert_from_path`方法可以从文件路径中读取PDF文件并将其转换为图像文件。示例如下: ``` images = convert_from_path('path/to/pdf/file.pdf') ``` `convert_from_bytes`方法可以从二进制数据中读取PDF文件并将其转换为图像文件。示例如下: ``` with open('path/to/pdf/file.pdf', 'rb') as file: pdf_data = file.read() images = convert_from_bytes(pdf_data) ``` 转换后的图像文件将会返回一个图像文件列表。可以循环遍历这个列表来处理每一页的图像文件,或者可以直接使用索引访问特定页的图像文件。 除了基本的转换功能外,pdf2image还提供了一些可选的参数,用于配置图像的转换。通过这些参数,可以设置图像的分辨率、输出格式、图像质量等。 总之,Pythonpdf2image是一个简单易用的工具,可以帮助我们将PDF文件转换为图像文件,非常适合用于处理和操作PDF文件中的内容和数据。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值