【text recognition算法】AON: Towards Arbitrarily-Oriented Text Recognition

 

CVPR 2018

  • Introduction

  这个模型是作者针对基于STN的不规则文本识别算法难以训练,需要人工标记的缺点,来提出的一种全新的对任意方向文本进行识别的算法。

 

  • Model

整体架构

整个模型分为三个部分,BCNN基本CNN层用来对input image提取出feature map,AON+FG是本算法的核心,基本思路是将文本方向分为Left2Right,Right2Left,Bottom2Top,Top2Bottom,对这四个方向提取四个sequence vector和一个权重向量,在FG层将四个sequence和权重进行组合形成最终的sequence,然后输入带有Attention机制的Decoder从而输出最终文本。

 

 

2.1 BCNN

输入输出是square feature maps

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值