python pdf2image库使用

第一步安装pdf2image

pip install pdf2image

官网

https://pypi.org/project/pdf2image/

Windows:需要下载poppler ,

下载链接

https://github.com/oschwartz10612/poppler-windows/releases/

mac:

brew install poppler

用法

import pdf2image
from pdf2image import convert_from_path

f_name = "11.pdf"

convert_from_path(
    pdf_path=f_name,  # 要转换的pdf的路径
    dpi=200,  # dpi中的图像质量(默认200)
    output_folder='./Musics',  # 将生成的图像写入文件夹(而不是直接写入内存)#注意中文名的目录可能会出问题
    first_page=1,  # 要处理的第一页
    last_page=1,  # 停止前要处理的最后一页
    fmt="png",  # 输出图像格式
    jpegopt=None,  # jpeg选项“quality”、“progressive”和“optimize”(仅适用于jpeg格式)
    thread_count=4,  # 允许生成多少线程进行处理
    userpw=None,  # PDF密码
    use_cropbox=False,  # 使用cropbox而不是mediabox
    strict=False,  # 当抛出语法错误时,它将作为异常引发
    transparent=False,  # 以透明背景而不是白色背景输出。
    single_file=False,  # 使用pdftoppm/pdftocairo中的-singlefile选项
    poppler_path="D:/codegithub/poppler-23.01.0/Library/bin",  # 查找poppler二进制文件的路径
    grayscale=False,  # 输出灰度图像
    size=None,  # 结果图像的大小,使用枕头(宽度、高度)标准
    paths_only=False,  # 不加载图像,而是返回路径(需要output_文件夹)
    use_pdftocairo=False,  # 用pdftocairo而不是pdftoppm,可能有助于提高性能
    timeout=None,  # 超时
)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值