最近在研究如何把pdf中的表格提取出来,从网上找了很多方法,如Camelot、tabula、pdfminer等,但是至今为止无一成功o(╥﹏╥)o
今天在调试Camelot相关程序时,一直出现一个错误
AttributeError: module ‘camelot‘ has no attribute ‘read_pdf‘
开始查阅资料,发现有以下几种原因——
快捷键win+R打开运行,输入cmd,进入界面,输入
pip install opencv-python
安装cv2
(注意:cv2不是通过pip install cv2 安装,而是上面这个名字)
此方法的来源:https://www.it610.com/article/1295291289151021056.htm
查阅资料后发现,答主出现的错误可能是因为在pip安装时,如果不加后缀 安装的是
Camelot
就会出现错误
需要安装的是
Camelot-py
或者
Camelot-py[cv]
或者
Camelot-py[all]
如果确认是这类错误之后,可以挨个安装试验,如果失败则卸载安装下一种
安装方法:(以Camelot-py为例)
快捷键win+R打开运行,输入cmd,进入界面,输入
pip install camelot-py
如果运行仍然失败,则输入
pip uninstall camelot-py
再用另一种语句安装
答主本人安装的是第二种,在之后调试好问题之后就运行成功了
此方法的来源:https://www.cnpython.com/qa/244461
网上说pycharm有可称之为漏洞的问题,是有时在cmd中用pip安装包后无法在pycharm里正常使用
此时需要在设置(setting)中的项目(project)里面的Project Interpreter里手动导入对应包
起初以为是没有导入包的原因,但是导入成功之后还是有错误,于是查找别的问题
如还未成功的话,通过参考GitHub上大神的做法,可以把
import Camelot
改成
import Camelot.io as Camelot
此方法的来源:https://github.com/atlanhq/camelot/issues/389
最终发现我的错误是因为:
程序命名和包的命名一样,就会出现这种错误
将Camelot改成Camelot1,成功运行o(╥﹏╥)o
此方法的来源:
http://www.mamicode.com/info-detail-2094708.html
总结(絮絮叨叨)
这种问题应该同属于一种问题
触类旁通希望也可以解决其他类似的问题
上课的时候好好听课就好了
(但好像上课也没讲)
果然编程是需要大量练习并发现错误的!
改bug的时候真心痛苦,改了一上午就改出来这一个错误
但是成功的时候也是通体舒畅!
第一次发博
如有问题,欢迎大佬指导评论~
如文字赘余、语义不清等,请谅解~