2019-07-10:OCR之技术调研

一、开源引擎

Cuneiform for Linux —— 本来是个Windows软件,这是Linux的移植,2011年4月已经停止维护。

GNU Ocrad —— 命令行工具。有JS移植,可用于前端。

GOCR —— 命令行工具。有JS移植,可用于前端。

Tesseract —— 开源OCR引擎,也有命令行工具。HP开发Google接手。3.0之后支持训练。Golang绑定。入门教程。

OCRopy —— 基于训练的OCR引擎,训练后可以达到比Tesseract更高的准确度,项目比Tesseract更年轻。包含一个叫做OCRopus的布局分析器。in Python。

Microsoft OCR Library —— Windows8.1之后的版本内置OCR引擎,可用于桌面和WindowsPhone。

Abbyy —— 收费软件,有SDK,有Cloud版本。

二、预处理代码

OpenCV —— 图像处理老大哥。OpenCV3中有Scene Text Detection值得一用。

Libccv —— 现代图像处理库,被很多人推荐。实现了精选的若干个图像处理算法,干净容易移植。其中Stroke Width Transfor尤其有用。

lswms —— 分行检测。

OCRopus —— 基于神经学习网络算法的布局分析库。教程。

TiRG —— 文字区域检测库,效果演示。

unpaper —— 检测文字和旋转,用的是Hough transform算法。

三、android移动端

tess-two:Tesseract的安卓移植,教程。

microblink:免费的移动OCR-SDK。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值