使用Python批量按顺序和数量合并PDF文件

此代码主要解决批量合并PDF文件的问题,按照文件顺序的前提文件名按数字命名如(1.pdf、2.pdf....),可以通过修改数量得到自己想要的合并效果。需要能帮助到大家!

在运行前要确保安装了PyMuPDF包

pip install PyMuPDF
import os
import fitz  
import glob
import re

# 需要合并的PDF文件所在的目录
pdf_directory = "F:\\8.22\\PDF"

# 使用 glob 模块获取目录下所有PDF文件路径
pdf_files = glob.glob(os.path.join(pdf_directory, "*.pdf"))

def sort_key(file_path):
    base_name = os.path.basename(file_path)
    match = re.search(r'\d+', base_name)
    if match:
        return int(match.group())
    return base_name

pdf_files.sort(key=sort_key)

# 每批处理的文件数量
batch_size = 100

# 记录错误信息
error_files = []

# 分批合并PDF文件
for batch_index in range(0, len(pdf_files), batch_size):
    batch_files = pdf_files[batch_index:batch_index + batch_size]
    
    # 初始化 output_pdf
    output_pdf = fitz.open()
    
    # 按照排序后的顺序合并当前批次的PD
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Vᥫ᭡້໌ᮨ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值