PDF文件合并 –Python

本文介绍了使用Python进行PDF文件合并的方法,包括安装PyMuPDF库,明确了将PDF合并的多种需求,如处理当前目录、子目录下的文件。讨论了目录操作、函数式编程的实现,并对比了PyPDF2、PyPDF4和PyMuPDF库的不同合并方法,提供了具体的代码实现。
摘要由CSDN通过智能技术生成

安装

因版本差异,可能会产生报错。

  • Python
import platform

print(platform.python_version())  # 3.9.10

代码中使用了“海象运算符”,其为3.8版本新的特性。

  • PyMuPDF
import fitz

print(fitz.__doc__)

# Result 
"""
PyMuPDF 1.19.4: Python bindings for the MuPDF 1.19.0 library.
Version date: 2022-01-01 00:00:01.
Built for Python 3.9 on win32 (64-bit).
"""

更多信息,请查看官方说明

安装

python -m pip install --upgrade pymupdf

明确目标

Simple case

将当前目录设置为程序 myscript.py 的位置。

了解需求
  • 当前目录中的PDF文件
  • 当前目录中的文件夹内的PDF文件
  • 当前目录中的文件夹及子文件夹内的PDF文件

思考:如何命名合并后的文件?

Part I

目录对象的操作,如何实现?

  1. 使用 os.listdir() + 递归方式
  2. 使用 os.walk()
  3. 函数式编程实现

思考:以上三个方法的共同点是什么?

Part II

合并PDF文件的有哪些方法?

  • PyPDF2

  • PyPDF4

    PyPDF2 & PyPDF4 库均有2种方法实现 PDF文件的合并。

  • PyMuPDF

    Document.insert_page()
    Used in the command lines


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值