安装
因版本差异,可能会产生报错。
- Python
import platform
print(platform.python_version()) # 3.9.10
代码中使用了“海象运算符”,其为3.8版本新的特性。
- PyMuPDF
import fitz
print(fitz.__doc__)
# Result
"""
PyMuPDF 1.19.4: Python bindings for the MuPDF 1.19.0 library.
Version date: 2022-01-01 00:00:01.
Built for Python 3.9 on win32 (64-bit).
"""
更多信息,请查看官方说明
安装
python -m pip install --upgrade pymupdf
明确目标
Simple case
将当前目录设置为程序 myscript.py
的位置。
了解需求
- 当前目录中的PDF文件
- 当前目录中的文件夹内的PDF文件
- 当前目录中的文件夹及子文件夹内的PDF文件
思考:如何命名合并后的文件?
Part I
目录对象的操作,如何实现?
- 使用 os.listdir() + 递归方式
- 使用 os.walk()
- 函数式编程实现
思考:以上三个方法的共同点是什么?
Part II
合并PDF文件的有哪些方法?
-
PyPDF2
-
PyPDF4
PyPDF2 & PyPDF4 库均有2种方法实现 PDF文件的合并。
-
PyMuPDF
Document.insert_page()
Used in the command lines