win10非anaconda的tesserocr安装

对于没使用anaconda的我,是这样安装tesserocr的。

首先安装tesseract

https://digi.bib.uni-mannheim.de/tesseract/里找到非dev的稳定版本,对应py3.5的tesseract-ocr-setup-3.05.01-20170602.exe。
双击安装后,选择additional language data(download)支持多语言。
安装完毕后,配置环境变量,把tesseract的安装路径加入path里,再新增环境变量名为TESSDATA_PREFIX,值也为tesseract的安装路径。
在cmd中,试一下命令,可行。
找一张图形验证码,试一下

tesseract image.png result -l eng && type result.txt

可以输出验证码字母。

接着安装tesserocr

直接执行

pip install tesserocr pillow

结果报错Microsoft Visual C++ 14.0 is required

需要在https://github.com/simonflueckiger/tesserocr-windows_build/releases下载与已安装的tesseract对应的tesserocr的whl文件。
然后 pip install 这个whl文件,即可。
这时我发现在cmd中可以import tesserocr, 在pycharm中却不能import。
错误如下

Traceback (most recent call last):
  File "c:\Users\NewJune\test.py", line 4, in <module>
    print(tesserocr.image_to_text(image))
  File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\Python36\

有一种可能是pycharm的interpreter的path应该调整为与终端一致,
以下命令用来查看interpreter path

import sys
print sys.executable

我不是因为这个,经过查看,将tesserocr安装目录下的tessdata文件夹复制到当前编译器的scripts目录下即可。

感谢windows(win10)下tesserocr的安装的指导~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值