TextScanner 阅读笔记

Textscanner 阅读笔记

 

Motivaction:

(1):在文本识别领域,从语音识别,以及NLP中学来的基于RNN-attention-based的方法主宰了文本识别领域,在大多数情况下,基于RNN注意的方法通常效果很好。但是,当背景中出现噪音或文本形状不规则时,注意机制可能无法使估计的注意图的中心对准错误的位置,从而导致字符顺序和类别错误(请参见图1)。更严重的是,由于RNN模块中的循环存储机制,此类错误将累积并传播,使情况变得更糟。

          (2):基于语义分割的算法探索了不同的方式,并且展现出了对不同形状(水平,定向和弯曲)文本的更强适应性。然而,由于不正确的二值化会导致这样的尴尬,因此很难成功地将每个字符与分割图分开:一个字符可能会分成多个部分,或者多个字符可能会粘在一起(见图1)。在这些情况下,字符数量和类别的预测将是错误的。总之,现有的方法,无论是基于RNN注意力还是基于语义分割,都不能令人满意地解决场景文本识别中的难题。

 

 

                                  图(1)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值