python3合并多个pdf(使用pypdf库)

该文章介绍了如何在Python环境中利用pypdf库合并PDF文件。首先,通过pip安装pypdf库,然后获取当前目录下所有PDF文件的列表,排除已合并的文件。接着,使用PdfMerger类创建一个合并器,将所有PDF文件添加到合并器中,并将结果保存到一个新的PDF文件中。文章还提供了更多合并选项的参考资料。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装pypdf库

pip install pypdf

获取文件列表

# 合并后的文件名
mergeFileName = 'merged.pdf'

# 获取当前目录下所有PDF文件,并按照文件名自然排序(要排除合并后的文件,避免多次合并造成内容重复)
pdf_files = sorted([f for f in os.listdir('.') if f.endswith('.pdf') and f != mergeFileName], key=lambda x: [int(c) if c.isdigit() else c for c in re.split('(\d+)', x)])

合并PDF

参考官网文档:
https://pypdf2.readthedocs.io/en/stable/user/merging-pdfs.html#basic-example


# 创建PDF文件写入器
merger = PdfMerger()

# 将所有PDF文件添加到写入器中
for pdf in pdf_files:
    merger.append(pdf)


# 将合并后的PDF文件保存到磁盘上
# "wb" 以二进制写方式打开,只能写文件。如果文件不存在,创建该文件;如果文件已存在,先清空,再打开文件。
with open(mergeFileName, 'wb') as output:
    # 写入合并后的PDF文件
    merger.write(output)
    merger.close()

如果需要更多合并选项,参考:
https://pypdf2.readthedocs.io/en/stable/user/merging-pdfs.html#showing-more-merging-options

https://stackoverflow.com/questions/3444645/merge-pdf-files

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值