![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文字识别经典论文
文章平均质量分 94
chibohe123
这个作者很懒,什么都没留下…
展开
-
文字识别领域经典论文回顾第四期:ASTER
1. 开篇在之前介绍的三篇论文,处理的对象都是水平的文本,常见于各类票据卡证等。而在自然场景中,因为图片本身属性的问题,加上拍摄角度的不同,往往会造成图片里文字的扭曲,主要包括弯曲、透视、多方向等问题。为了解决此类问题,本文提出了一类基于矫正器的文字识别方法。代码可以参考:https://github.com/ayumiymk/aster.pytorch2. 论文解读2.1 总览ASTER是2018年提出的论文,论文的全称是《ASTER: An Attentional Scene Text原创 2021-09-30 17:59:24 · 1093 阅读 · 0 评论 -
文字识别领域经典论文回顾第三期:FAN
1. 开篇基于深度学习的文字识别发展到现在,就解码方法来分类,大体上可以分成使用CTC的解码方式以及attention的解码方式,当然落在具体的实现上会有多种多样的细分。前两期介绍的都是基于CTC解码的论文,本期就来介绍一下基于attention的一篇经典论文,其中首次提出了attention drift这个概念,直到现在这个概念还在被引用。代码实现可见:GitHub - chibohe/text_recognition_toolbox: text_recognition_toolbox: The re原创 2021-09-30 17:52:31 · 327 阅读 · 0 评论 -
文字识别领域经典论文回顾第二期:GRCNN
1. 开篇循着第一篇CRNN的路径,我们介绍这个系列的第二篇论文——GRCNN.因为CRNN已经搭建起了一个清晰简洁的文字识别框架,加上受到RCNN(Recurrent Convolution Neural Network)的启发,本文很自然的将CRNN的backbone替换成了RCNN,从而提出了GRCNN的识别方法。代码实现可见:GitHub - chibohe/text_recognition_toolbox: text_recognition_toolbox: The reimplementat原创 2021-09-30 17:34:36 · 806 阅读 · 0 评论 -
文字识别领域经典论文回顾第一期:CRNN
文字识别领域经典论文回顾第一期:CRNN1. 开篇在文字识别经典论文回顾这个系列里,我会介绍从深度学习兴起后,文字识别领域一系列经典的论文。这些论文的挑选标准主要有两方面,一是是否具有足够的启发性,对解决文字识别领域的问题是否具有足够的推进作用。二是论文的算法是否简洁且统一,便于我们自己去复现。基于以上两点,我的介绍也自然分为两个方面,一方面是论文本身的解读,二是代码的解读。对于所有将要介绍论文,我都会用一个统一的代码框架进行复现,代码地址为:https://github.com/chibohe/t原创 2021-01-22 12:12:18 · 715 阅读 · 0 评论