1、Tesseract是什么
tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载。
实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesseract
2 - 执行程序方式 tesseract
.exe
最新版3.5.1、4.0.0版本,提供linux、macOS、Windows版本
2、Tesseract安装包下载
Tesseract的release版本下载地址:https://github.com/tesseract-ocr/tesseract/wiki/Downloads,这里需要注意这一段话:
Currently, there is no official Windows installer for newer versions.
意思就是官方不提供最新版windows平台安装包,只有相对略老的3.02.02版本,其下载地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/。
最新版3.5.1、4.0.0版本,都是三方维护和管理的安装包,有好几个发行机构,分别是:
-
Cygwin includes packages for Tesseract.
-
binaries compiled by @egorpugin (ref issue # 209) https://www.dropbox.com/s/8t54mz39i58qslh/tesseract-3.05.00dev-win32-vc19.zip?dl=1
You have to install VC2015 x86 redist from microsoft.com in order to run them. Leptonica is built with all libs except for libjp2k.利普顿卡是用所有的libs构建的,除了libjp2k,为了运行它们,您必须从microsoft.com安装VC2015 x86 redist。
-
https://github.com/UB-Mannheim/tesseract/wiki (installers available for version 3 and 4)
总结一下:
2、https://github.com/parrot-office/tesseract/releases/tag/3.5.1