环境:win7_64 py3
第一步:安装pdf操作库 pdfminer3k
pdfminer3k是python3使用的pdfminer的版本,
这里安装一定要选定稳定版版本号,
pip自动选择的最新版,貌似有问题,坑了我好久
具体用法官网看文档
https://pypi.org/project/pdfminer3k/1.0.1/
pip3 install pdfminer3k =1.2.4
第二步:测试程序
# encoding: utf-8
import sys
import importlib
importlib.reload(sys)
from pdfminer.pdfparser import PDFParser,PDFDocument
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import PDFPageAggregator
from pdfminer.layout import LTTextBoxHorizontal,LAParams
from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
'''
解析pdf 文本,保存到txt文件中
'''
path ="example.pdf"
def p