软件方面
OCR引擎
老的OCR引擎
OCR文件格式
HOCR
ALTO XML
TEI
OCR CLI
OCR GUI
OCR预处理
OCR服务
OCR评估
OCR库(按编程语言排序)
Go
Java
.Net
Javascript
PHP
Python
Ruby
OCR培训工具
· 学术方面
OCR相关出版物和链接列表
博客帖子和教程
OCR一些实例
学术文章
软件方面
OCR引擎
··· tesseract - 最基础的奠基性的OCR引擎Apache 2.0
··· ocropus - 基于LSTM的OCR引擎,Apache 2.0
··· ocropus 0.4 - 较老的v0.4版本的Ocropus,包含tesseract 2.04和iulib,C ++
··· Kraken - Ocropus交叉版
··· Ocrad - GNU OCR,GPL
··· Digit - OCR用于数字显示,例如功率计,使用Caffe
··· ocular - 机器学习OCR用于历史文件
··· SwiftOCR - 快速简单的OCR库,用Swift编写
··· Attention OCR - 使用视觉注意机制OCR引擎
··· RWTH-OCR - 亚琛大学光学字符识别系统
··· simple-ocr-opencv及其fork - 一个使用opencv和numpy的简单的pythonic OCR引擎
比较老且可能被废弃的OCR引擎
··· Clara OCR - C GPL中的开源OCR引擎
··· CuneiForm - CuneiForm OCR由Cognitive Technologies开发
··· Eye - 实验性Java OCR(图像到文本)应用程序
··· kognition - 用于KDE的Omnifont OCR软件
··· OCRchie - 模块化光学字符识别软件
··· ocre - ocr易用版
··· xplab - 用于模式匹配的GTK 2工具
··· hebOCR - 希伯来文字符识别库(以前命名为hocr,请参阅维基百科文章)GPL
OCR文件格式
··· abby2hocr.xslt XSLT脚本
··· OCR转换脚本
HOCR
··· horc-tools - 使用hOCR文件格式,用于做各种有用事情的工具,Apache 2.0
··· hocr-spec -hOCR 1.1规范
··· ocr-transform - 用于在hOCR和ALTO之间转换的CLI工具,MIT
··· hocr-parser - hOCR规范Python Parser
··· hOCRTools - hOCR到为ALTO转换XSLT
ALTO XML
··· ALTO XML Schema - XML Schema和ALTO XML格式的开发
··· ALTO XML Documentation - ALTO的文档和用例
··· alto-tools - 使用ALTO文件的各种工具,Python
··· AbbyyToAlto - 从Abbyy 6转换来的ALTO XML的PHP脚本
TEI
··· TEI-OCR -TEI,为OCR定制,用于生成的布局和内容信息
··· TEI SIGon Libraries - TEI库的最佳实践
··· GDZ - 基于METS / TEI的GDZ文档格式
OCR