win10 安装tesseract+tesserocr+pycharm导入tesserocr,各种问题+解决办法
我的环境是 python3.7
一、
本人参照书上相关操作步骤安装,遇到好多报错,参照了好多网页,大部分问题是在这里解决
https://blog.csdn.net/qq_41895190/article/details/82696550
上述链接中有详细的安装方法和添加环境变量和PATH的过程
别忘了看好自己python版本对应的包
tesseract的包在这里下载
https://digi.bib.uni-mannheim.de/tesseract/
tesseror的包在这里下载(一定记住tesseract和tesserocr的版本一定要对应)
https://github.com/simonflueckiger/tesserocr-windows_build/releases
二、
本人按上述操作后还是出现如图所示问题当cmd里面直接pip tesserocr的时候出现找不到文件等报错信息时,将下好的.whl包放到一个路径内如D:\Python,如图所示
然后在cmd中切换工作目录到这里
切换时发现cd目录切换不了,查找问题时发现是这个原因
https://blog.csdn.net/albertjone/article/details/79333160
替换成自己的目录之后再使用pip3 install tesserocr-2.3.1-cp37-cp37m-win_amd64.whl
即可安装成功
三、
在cmd里面执行python命令import tesserocr,然后看能否正常导入tesserocr
如果报错了,按下图方式
图是别人的
四、
在pycharm中测试如下代码
import tesserocr
from PIL import Image
image= Image. open('C:\\Users\\DELL\\Desktop\\7.png')
result = tesserocr.image_to_text(image)
print(result)
发现tesserocr导不进去,在settings中搜索tesserocr安装总是显示失败
这时我参照了很多网页
这个博主解决了这个问题
https://blog.csdn.net/qq_28831197/article/details/81103897
pip安装pytesseract能在一定程度上代替tesserocr
最后发现一个解决办法,在pycharm中也不能安装tesserocr,但是CMD中却安装成功,将已经安装好了的tesserocr的包直接拷贝到pycharm项目中的site-packages下,问题解决。
五、
在运行时,也许会出现类似这种报错
RuntimeError: Failed to init API, possibly an invalid tessdata path: E:\Users\moxia\
这时找到我们安装的Tesseract_OCR的tessdata的目录
把tessdata复制到这个报错的那个位置,此时运行正常!
(此问题参照网页
https://blog.csdn.net/moxiao1995071310/article/details/82630996)