想将一批pdf文件批量转换成txt格式,在导入库时出现“ImportError: cannot import name 'HOCRConverter' from 'pdfminer.converter'”问题。关键是我没import HOCRConverter。
搞了大半天才解决这个问题。
第一步:
首先,检查电脑里已经安装了哪些python库,核心要求就是要保证安装了pdfminer.six但没安装pdfminer。在终端窗口中输入以下指令:
pip list
如果你的电脑里已经同时安装了pdfminer与pdfminer.six这两个python库,我们要保证只安装了pdfminer.six这一个库。所以需要将pdfminer卸载,在终端窗口中输入以下指令:
pip uninstall pdfminer
如果你的电脑里pdfminer与pdfminer.six这两个python库都没有,那就安装pdfminer.six这一个库,在终端窗口中输入以下指令:
pip install pdfminer.six
第二步:
如果仍然遇到错误,就重启计算机!
试试效果:
from pdfminer.high_level import extract_text
不报错了!