Free OCR Softwares
- Google's & HP's Tesseract
- Google's Keep
- Microsoft Document Imaging ( MODI ) ( assuming majority of us would be having a windows OS )
- Microsoft One Note
- Microsoft Oxford Project API ( This API is free until some time )
- FreeOCR ( This is based on Tesseract engine again )
Commercial Products
- Adobe Acrobat Pro ( RTF file format gives you best result )
- Captiva
- Abbyy
- Informatica ( Not sure which module within Informatica )
- IBM Datacapture (Datacap) (IBM Watson)
优秀的开源OCR软件包括:
Tesseract
原本由惠普开发的图像识别类库tesseract-ocr已经更新到2.04, 就是最近Google支持的那个OCR。原先是惠普写的,现在Open source了。
OCRopus
Ocropus的(TM)是一个先进的文件分析和OCR系统,采用可插入的布局分析,可插入的字符识别,自然语言统计建模和多语言支持功能。
Cuneiform
Cuneiform 是一个 OCR 文字识别系统的商标,最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在 Linux 系统下的移植版本。
GOCR
GOCR 是一个开源的OCR光学识别程序。
Tesseract
原本由惠普开发的图像识别类库tesseract-ocr已经更新到2.04, 就是最近Google支持的那个OCR。原先是惠普写的,现在Open source了。
OCRopus
Ocropus的(TM)是一个先进的文件分析和OCR系统,采用可插入的布局分析,可插入的字符识别,自然语言统计建模和多语言支持功能。
Cuneiform
Cuneiform 是一个 OCR 文字识别系统的商标,最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在 Linux 系统下的移植版本。
GOCR
GOCR 是一个开源的OCR光学识别程序。
OCRFeeder
OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
Lios
linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案,可将打印的文档转成可编辑的文本。
OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
Lios
linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案,可将打印的文档转成可编辑的文本。
清华紫光OCR
尚书七号
ABBYY FineReader OCR
Leadtools Ocr
汉王
尚书七号
ABBYY FineReader OCR
Leadtools Ocr
汉王
文通
赛酷OCR
Expervision,Inc OCR
丹青
赛酷OCR
Expervision,Inc OCR
丹青