参考:
Tesseract-OCR的安装和使用
1、Tesseract-OCR安装包的下载:
下载地址:添加链接描述
等待下载完成
2、添加语言包:
语言包下载地址:添加链接描述
语言包下载完成后放入Tesseract-OCR的tessdata中。
3、安装Tesseract-OCR
点击exe可执行文件,进行安装,一直点击next,完成安装。
4、安装完成后配置环境变量
打开此电脑中高级属性设置,
配置环境变量
5、在path变量中增加自己的Tesseract-OCR安装路径
6、添加语言包环境变量;
设置变量名和变量值如下:
变量名:TESSDATA_PREFIX
变量值:D:\Tesseract_OCR\tessdata(自定义的语言包位置)
配置完成后点击确定。
7、测试安装是否成功
win+R,打开cmd
命令行中输入:tesseract --version
8、查看可支持的语言:
命令行中输入:tesseract --list-langs
使用:
1、默认是能识别英文和数字
tesseract 被识别的图片路径 存放识别结果的文本文件路径
2、添加中文语言包后可以识别中文
tesseract 被识别的图片路径 存放识别结果的文本文件路径 -l chi_sim