-
首先下载Tesseract_OCR,下载地址https://github.com/UB-Mannheim/tesseract/wiki
安装Tesseract_OCR时只能选择默认的安装组件,否则安装时会报错 -
默认的语言只有英语eng,汉语语言包chi要单独下载,下载地址https://tesseract-ocr.github.io/tessdoc/Data-Files
语言包下载到Tesseract_OCR的安装目录中的tessdata文件夹里 -
将安装目录添加到环境变量中的系统变量PATH中
-
在系统变量中增加变量TESSDATA_PREFIX,值设为tessdata文件夹的路径
接下来就可以在命令行使用Tesseract了。 -
简单命令
tesseract FILE OUTPUTBASE [OPTIONS]… [CONFIGFILE]…
详细命令https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc
#不说明语言则默认是英语
C:\Users\12709>tesseract D:\test4.png D:\result
#英语
C:\Users\12709>tesseract D:\test4.png D:\result -l eng
#汉语
C:\Users\12709>tesseract D:\test4.png D:\result -l chi_sim