【text recognition算法】AON: Towards Arbitrarily-Oriented Text Recognition

nihaoamoshengren

于 2019-05-22 11:58:48 发布

阅读量1.9k

点赞数 1

文章标签： ocr text recognition

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuningli84019582/article/details/90441306

版权

CVPR 2018

Introduction

这个模型是作者针对基于STN的不规则文本识别算法难以训练，需要人工标记的缺点，来提出的一种全新的对任意方向文本进行识别的算法。

Model

整体架构

整个模型分为三个部分，BCNN基本CNN层用来对input image提取出feature map，AON+FG是本算法的核心，基本思路是将文本方向分为Left2Right，Right2Left，Bottom2Top，Top2Bottom，对这四个方向提取四个sequence vector和一个权重向量，在FG层将四个sequence和权重进行组合形成最终的sequence，然后输入带有Attention机制的Decoder从而输出最终文本。

2.1 BCNN

输入输出是square feature maps

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。