本文将说明如何使用 PyPDF2 以及正则表达式操作 PDF 文件,并从中提取有关信息。
PyPDF2
在 Python 中,用于处理 PDF 文件的库有很多,比如:
以上列举的几个是比较典型的库,此外还有很多,不再一一列举。
本文介绍的库名为 PyPDF2 ,其安装方法(注意,区分大小写)
|
|
每个用于读取 PDF 文件的库都有自己的特点,PyPDF2 亦非万能,如果 PDF 文件太模糊、有特殊编码、加密,或者创建的 PDF 文件的特定程序与PyPDF2不兼容