一、开源引擎
Cuneiform for Linux —— 本来是个Windows软件,这是Linux的移植,2011年4月已经停止维护。
GNU Ocrad —— 命令行工具。有JS移植,可用于前端。
GOCR —— 命令行工具。有JS移植,可用于前端。
Tesseract —— 开源OCR引擎,也有命令行工具。HP开发Google接手。3.0之后支持训练。Golang绑定。入门教程。
OCRopy —— 基于训练的OCR引擎,训练后可以达到比Tesseract更高的准确度,项目比Tesseract更年轻。包含一个叫做OCRopus的布局分析器。in Python。
Microsoft OCR Library —— Windows8.1之后的版本内置OCR引擎,可用于桌面和WindowsPhone。
Abbyy —— 收费软件,有SDK,有Cloud版本。
二、预处理代码
OpenCV —— 图像处理老大哥。OpenCV3中有Scene Text Detection值得一用。
Libccv —— 现代图像处理库,被很多人推荐。实现了精选的若干个图像处理算法,干净容易移植。其中Stroke Width Transfor尤其有用。
lswms —— 分行检测。
OCRopus —— 基于神经学习网络算法的布局分析库。教程。
TiRG —— 文字区域检测库,效果演示。
unpaper —— 检测文字和旋转,用的是Hough transform算法。
三、android移动端
tess-two:Tesseract的安卓移植,教程。
microblink:免费的移动OCR-SDK。