安装tesserocr
OCR 光学字符识别,翻译图形验证码。
1.首先安装tesseract,下载链接
下载地址
2. 安装
已安装完毕,不截图了,安装时最后一个选择是下载支持的语言包,大概有1G多,耐心等待即可。
3. 安装tesserocr
可以直接用:
pip(3) install tesserocr pillow
命令进行安装。
但我没有安装成功,所以下载了.whl文件进行安装。
下载后用 pip命令安装:
pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
同样的方法安装 Pillow即可。在PyChrome上可以搜索直接安装。
验证时出现错误
下载好一个图片
利用python代码来测试:
import tesserocr
from PIL import Image #Pillow
image=Image.open('image.png')
print(tesserocr.image_to_text(image))
出现错误
print(tesserocr.image_to_text(image))
File "tesserocr.pyx", line 2401, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Program Files (x86)\Microsoft\(python的安装目录)
怀疑是API或者testdata的路径有问题,将tesserocr安装目录下的testdata文件夹移到所提示的目录后就解决了。
输出 :IIUNO0BJIOM (感觉识别的不太准啊)