python 读取pdf图片_Python提取PDF第一页为封面图片【批量提取】

本文介绍了如何使用Python的PyMuPDF模块从大量PDF文件中批量提取第一页作为封面图片,详细展示了核心代码和操作步骤,并提供了相关说明和资源链接。
摘要由CSDN通过智能技术生成

近期要处理一批PDF文件,大约在20G,具体数量不详,需求是把每个文件的页数和第一页转换成图片,在网上查阅各种类库,最终选择的是PyMuPDF模块。最后核心代码量较少,功能实现效果也比较好。

一、安装扩展类pip install PyMuPDF

二、示例代码# coding:utf-8

import os

import fitz

# 解析

def analysis(file_path, save_path, num):

# 资源列表

file_array = []

if os.path.isdir(file_path):

# 目录循环压入

file_count = get_path_file(file_path)

for v in file_count:

file_array.append(v)

else:

# 单文件,单次调用

file_array.append(file_path)

# 判断为空情况

if not file_array:

print("此目录下无文件")

# 执行解析

file_count_num = len(file_array)

print("程序运行中,共计%s个文件" % file_count_num)

for v in file_array:

# print("文件路径:%s" % v)

# 获取文件名称及类型

file_n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值