Text recognition算法:ASTER:An Attentional Scene Text Recognizer with Flexible Rectification

ASTER是TPAMI 2018年提出的一种用于识别不规则文本的深度学习模型,它包含矫正网络和识别网络两部分。矫正网络通过结合TPS(薄板样条插值)和STN(空间变换网络)进行图像形变,而识别网络采用带有Attention机制的CRNN模型进行文字识别。ASTER在irregular text识别上表现优秀,为端到端的文本识别提供了解决方案。
摘要由CSDN通过智能技术生成

ASTER:An Attentional Scene Text Recognizer with Flexible Rectification

TPAMI 2018

 

  • Introduction

  目前对于regular text的识别算法的研究,在几个regular text标准数据集icdar2003,icdar2013,svt,IIIT5k上面的state-of-art算法的识别精度已经达到95%以上。于是研究趋势开始转向识别难度更大,现实生活中更常出现的irregular text的识别上。ASTER算法和MORAN相似,分为两个子网络一个矫正网络和一个识别网络,整体是一个可训练的端到端的网络。

整体框架

  • Model

2.1 Rectification Network

  这

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值