在Windows下安装tessocr,首先需要下载tesseract,它为tesserocr提供了支持。
tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/
进入下载页面,可以看到有各种.exe文件的下载列表,这里可以选择下载3.0版本。示例为3.05版本。
其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本,例如可以选择下载tesseract-ocr-setup-3.05.01.exe。
下载完成后双击,此时会出现如图1-25所示的页面。
此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言。然后一路点击Next按钮即可。
接下来,再安装tesserocr即可,此时直接使用pip安装:
不建议使用虚拟环境中使用 pip installl tesserocr(运行会报错)
pycharm可以使用pytesserocr(仍然无法运行,有的伙伴这里可以使用)
解决方式
5.1 :CMD管理员模式 输入pip install wheel 等待安装完成;
5.2 : 升级pip
5.3: CMD下输入: pip install tesserocr-2.2.2-cp36-cp36m-win64.whl
whl文件下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
5.4重点一步:将tesseract安装目录中的tessdata数据copy到python安装目录中(或虚拟环境中) ok