1.下载Tesseract
Tesseract本身没有windows的安装包,不过它指定了一个第三方的封装的windows安装包,大家可直接到这个地址进行下载:
https://digi.bib.uni-mannheim.de/tesseract/
安装包如下图:
2、解压安装包
我的安装路径D:\app2\Tesseract
3、配置环境变量
在方框添加tesseract的安装路径,例如我的安装路径为:D:\app2\Tesseract
4、查看信息
安装完成后,启动cmd,查看版本信息,如果没有的话,就表示没有安装成功。
注意输入tesseract -v 的时候,要先进入tesseract的安装路径,cmd更改路径的命令为cd,不同硬盘之间的更改路径为cd /d 。
5、语言包下载
本人做的文本识别不仅有英文,还有简体中文等,所以需要下载语言包。
语言包下载保存在Tesseract\tessdata路径下。
注意版本不同,对应的安装包不同。
下载路径:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。