自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 文字识别领域经典论文回顾第四期:ASTER

1. 开篇在之前介绍的三篇论文,处理的对象都是水平的文本,常见于各类票据卡证等。而在自然场景中,因为图片本身属性的问题,加上拍摄角度的不同,往往会造成图片里文字的扭曲,主要包括弯曲、透视、多方向等问题。为了解决此类问题,本文提出了一类基于矫正器的文字识别方法。代码可以参考:https://github.com/ayumiymk/aster.pytorch2. 论文解读2.1 总览ASTER是2018年提出的论文,论文的全称是《ASTER: An Attentional Scene Text

2021-09-30 17:59:24 1093

原创 文字识别领域经典论文回顾第三期:FAN

1. 开篇基于深度学习的文字识别发展到现在,就解码方法来分类,大体上可以分成使用CTC的解码方式以及attention的解码方式,当然落在具体的实现上会有多种多样的细分。前两期介绍的都是基于CTC解码的论文,本期就来介绍一下基于attention的一篇经典论文,其中首次提出了attention drift这个概念,直到现在这个概念还在被引用。代码实现可见:GitHub - chibohe/text_recognition_toolbox: text_recognition_toolbox: The re

2021-09-30 17:52:31 327

原创 文字识别领域经典论文回顾第二期:GRCNN

1. 开篇循着第一篇CRNN的路径,我们介绍这个系列的第二篇论文——GRCNN.因为CRNN已经搭建起了一个清晰简洁的文字识别框架,加上受到RCNN(Recurrent Convolution Neural Network)的启发,本文很自然的将CRNN的backbone替换成了RCNN,从而提出了GRCNN的识别方法。代码实现可见:GitHub - chibohe/text_recognition_toolbox: text_recognition_toolbox: The reimplementat

2021-09-30 17:34:36 806

原创 文字识别领域经典论文回顾第一期:CRNN

文字识别领域经典论文回顾第一期:CRNN1. 开篇在文字识别经典论文回顾这个系列里,我会介绍从深度学习兴起后,文字识别领域一系列经典的论文。这些论文的挑选标准主要有两方面,一是是否具有足够的启发性,对解决文字识别领域的问题是否具有足够的推进作用。二是论文的算法是否简洁且统一,便于我们自己去复现。基于以上两点,我的介绍也自然分为两个方面,一方面是论文本身的解读,二是代码的解读。对于所有将要介绍论文,我都会用一个统一的代码框架进行复现,代码地址为:https://github.com/chibohe/t

2021-01-22 12:12:18 715

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除