tesseract的安装
1.1下载tesseract
在https://digi.bib.uni-mannheim.de/tesseract/中下载对应版本,这里博主下载的是2021年最新的
1.2安装tesseract
双击之后开始安装步骤,基本就无脑下一步即可
下载完双击打开,连续next,直到出现安装路径的时候,可以自定义安装路径也可以使用默认的安装路径,但是无论是哪一种一定要记住路径。
安装过程中,会让你安装额外的语言包,可根据选择下载。
1.3配置环境变量
我的是安装在C:\Program Files\Tesseract-OCR,界面如下:
将Tesseract-OCR添加到环境变量中。如图:
增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中;
1.4测试
打开命令终端,输入:tesseract -v,可以看到版本信息
将命令行切换至目标图像文件目录,比如我们转换文件为test.png(图片文件允许多种格式),位于C:\Users\22323\Desktop\image.jpg;然后在命令行中输入
tesseract test.png output_1 –l eng
识别结果: