环境:Python3.6.6
在windows下,首先需要下载tesseract,它为tesserocr提供了支持。
下载地址是 https://digi.bib.uni-mannheim.de/tesseract/
第一次安装下载的是不带dev的稳定版tesseract,但是后面始终安装pip3 install tesserocr pillow 失败:
解决方法:
进入环境:pip install wheel 等待安装完成;
如有提示则升级pip;
最后 pip install tesserocr-2.2.2-cp36-cp36m-win64.whl
(cp36代表的是python版本,这里如果不对应版本很容易出错!上述三步可以不按照先后顺序做。)
本人安装的是此版本:链接:https://pan.baidu.com/s/1OMcfH0FYZ3tFkZhK_Z89fw 提取码:3r8h
下载完成后双击,安装路径 D:\tesseract
此时会出现以下界面,此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言,语言较多,下载时间会比较长,请耐心等待,然后一路点击Next按钮即可。
配置相应的环境变量
搜索"环境变量“,找到用户变量和系统变量 两个【Path】项点开,都添加刚才拷贝的Tesseract 的安装路径
D:\tesseract
再找到【系统变量】,新建一个变量名称为:tesseract
值为:刚才路径加上 \tessdata D:\tesseract\tessdata
设置完环境变量后,以管理员身份 打开cmd窗口,看能否识别tesseract,输入命令tesseract -v
安装tesserocr
使用pip命令安装
pip install tesserocr pillow
解决办法是:
- 打开链接https://github.com/simonflueckiger/tesserocr-windows_build/releases
- 下载tesserocr-2.2.2-cp36-cp36m-win_amd64.whl 文件
- 然后在cmd命令行中 切换到该目录执行pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl,为防止其他问题产生,最好用管理员身份打开cmd窗口