OCR算法

OCR算法可以分为两阶段算法和端到端的算法。两阶段OCR算法分为文本检测和识别算法,文本检测算法从图像中得到文本行的检测框,然后识别算法识别文本框中的内容。端对端OCR算法使用一个模型同时完成文字检测和文字识别,因此端对端模型更小,速度更快。
深度学习技术在端到端文本识别方向具有代表性的方法。这些方法大致可以分为两类:
1)端到端规则文本识别(平直文本或倾斜文本);
2)端到端任意形状文本识别(弯曲、变形、平直、倾斜文本)。

类别论文
端到端规则文本识别FOTS(2018)、TextSpotter(2018)
端到端任意形状文本识别Mask TextSpotterv1、Mask TextSpotter2(2019)、Mask TextSpotterv3、TextDragon(2019)、CharNet、TUTS、ABCNet、ABCNetV2(2021)、Text Perceptron、PGNet、PAN++(2021)

参考链接:
《动手学OCR》系列课程之:端到端算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值