python 遍历文件夹PDF并转换成图片

本文介绍了一个Python脚本,利用PyMuPDF库遍历指定文件夹中的PDF文件,并将它们转换为图片。脚本首先获取文件夹中特定类型的文件列表,然后使用get_file_name函数获取文件的基本名称,最后调用pyMuPDF_fitz函数进行转换。
摘要由CSDN通过智能技术生成

这里写自定义目录标题


参考各路大神得出

-- coding: utf-8 --

import sys, fitz
import os
import datetime
import re

def get_file_list(dir, file_type_list=[‘pdf’,‘txt’, ‘csv’, ‘xlsx’, ‘xls’], file_list=[]):
‘’‘获取指定文件夹下指定类型文件路径
:param dir: 文件夹路径
:param file_type_list: 文件类型
:param file_list: 文件列表 ‘’’
for root, _, files in os.walk(dir):
for file in files:
file_type = file[file.rfind(’.’) + 1:]
if file_type in file_type_list:
file_list.append(os.path.join(root, file))
return file_list

def get_file_name(path_string):
“”“获取文件名称,不含后缀”""
pattern = re.compile(r’([^<>/\|:""*?]+).\w+$’)
data = pattern.findall(path_string)
if data:
return data[0]

def pyMuPDF_fitz(file_dir_path, out_file_path,file_type_list=[‘pdf’,‘txt’, ‘csv’, ‘xlsx’, ‘xls’]):
startTime_pd

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值