PDF的基本操作主要是读取、创建,合并等操作。使用Python的第三方包PyPDF2.读写合并PDF文件变得非常简单。本文最后给出PDF合并的程序,供参考使用。
欢迎关注我的个人公众号:数学编程,以及
安装依赖包
使用Python的pip进行安装,安装包名称大小写不敏感。
pip install PyPDF2
查看基本的类和方法
进入包的__init__.py文件可以看到主要的几个类和方法
from .pdf import PdfFileReader, PdfFileWriter
from .merger import PdfFileMerger
from .pagerange import PageRange, parse_filename_page_ranges
from ._version import __version__
__all__ = ["pdf", "PdfFileMerger"]
从名称上可以看出提供了基本的操作方法,分别是读取,写入和合并,其中合并可以认为是读取然后 再写入的操作。
读取和写入PDF
读取PDF非常简单,直接使用PdfFileReader这个类,先来看看这个类的参数
class PdfFileReader(object):
"""
Initializes a PdfFileReader object. This operation can take some time, as
the PDF stream's cross-reference tables are read into memory.
:param s