原本代码没有问题,某个瞬间手闲卸载了用了很久的conda3环境,结果,再运行代码的时候各种报错(╥﹏╥),明明用到的包都安装了……然后耗费了大半天时间终于把环境又配好了,记录一下
(哎,怪我手闲)
最耗费时间的这个问题主要是按照报错搜不到匹配度很高的信息,也可能是我犯的这个错太低级,并不能称之为错误((。•́︿•̀。)
然后最后找到解决办法,就是很简单,注释掉两行就行了,花了我一大段生命值, 吐血总结
报错信息
doc.set_parser(parser)
AttributeError: 'PDFDocument' object has no attribute 'set_parser'
网上搜索了好久都没解决,
最后发现这篇文章:
Phyton PDFMiner version diffs? Getting AttributeError: ‘PDFDocument’ object has no attribute ‘seek’ python pdfminer install,python pdfminer documentation
大致总结:
更新以后PDFMiner版本变了,有些语句要换种写法了。
1)
from pdfminer.pdfparser import PDFDocument, PDFParser
改为
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
2)
for i, page in enumerate(doc.get_pages()):
改为
for i, page in PDFPage.get_pages(doc):
3)以下语句注释掉或者删掉,不需要了
doc = PDFDocument()
doc.set_parser(parser)
doc.set_parser(parser)
doc.initialize('')
没有做1,2条就报错:
cannot import name ‘PDFDocument‘ from ‘pdfminer.pdfparser
没有做3条,就报错:
Error: 'PDFDocument' object has no attribute 'set_parser'
我就是没有做第三条,吐了2斤血,切记切记