这里不讲那些逻辑和原理,反正本人也搞不清,就谈谈自己的安装时候遇到的问题。
系统是win8.1
tesseract
tesseract安装需要到指定链接去下载(https://digi.bib.uni-mannheim.de/tesseract/)
此次选择的
tesseract-ocr-setup-3.05.01.exe
为什么选它,是因为后面tesserocr所要下载的版本必须和tesseract相对应,本来是下载tesseract-ocr-setup-5.0.0.exe的,但是tesserocr没有对应的版本,所以就放弃了,这是其一。
其二,所有含有dev的都是开发版,不带dev的是稳定版,所有选择tesseract-ocr-setup-3.05.01.exe
图1
下载完成之后,选择安装,这个就比较简单了,点击next就行了。
图2
如图2所示,此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言。然后一路点击Next按钮即可。(