官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
安装程序
访问上面的下载地址,选择最新稳定版本安装,选择安装的目录,比如我安装的目录是D:\tesseract_ocr5.0.0
下载语言包
在上面语言包下载地址下载语言包,简体中文为 chi_sim.traineddata
下载后放入tesseract程序目录的tessdata
文件夹中
设置环境变量
- 为了正确找到语言包位置,新建一个环境变量名为
TESSDATA_PREFIX
值为安装路径下的tessdata目录(如D:\tesseract_ocr5.0.0\tessdata) - 在环境变量
path
中添加安装路径D:\tesseract_ocr5.0.0
检查
检查版本
打开命令窗口输入 tesseract -v
检查语言包
打开命令窗口输入 tesseract --list-langs
参考资料
链接:https://www.jianshu.com/p/f7cb0b3f337a