Python中PDF文件的解析工具pdfminer是非常常用的一款工具,但在使用过程中可能会遇到"init got an unexpected keyword argument ‘codec’"这个错误。本文将提供两种解决方案,帮助大家顺利地使用pdfminer。
- 安装pdfminer.six
pdfminer.six是pdfminer的一个Python 3移植版,已经很好地维护了多年。使用pdfminer.six的话,我们可以直接通过pip安装:
pip install pdfminer.six
之后,我们就可以像下面这样来读取PDF文件:
from pdfminer.high_level import extract_text
text = extract_text(