tesserocr是Python的一个OCR识别库,核心是tesseract,因此在安装tesserocr之前,需要先安装tesseract。
下载tesseract
选择不带dev的即为稳定版本,这里选择tesseract-ocr-setup-3.05.01.exe
下载完成后,双击进入安装
如果嫌下载速度慢,这里提供网盘资源:
链接:https://pan.baidu.com/s/17dadvbJtCYy85btziHF21Q
提取码:1ghy
安装tesseract
安装tesseract时直接一路next即可,除非中间你想换安装地址,其他的不需要管,不然最终安装要报错Download error. status of afr: Send Request Error. Click OK to continue.
配置语言包
下载语言包,这里提供一个5种语言识别的语言包
链接:https://pan.baidu.com/s/1Cf8OH5qC0Vw7vOLYnlpVjA
提取码:n5ac
下载完成后,打开Tesseract-3.05-中英日韩-语言包\Tesseract-3.05\tes