CRAFT阅读笔记

Character Region Awareness for Text Detection
字符区域注意的文本检测
介绍:
可选择的,字符级的关注对于解决弯曲文本有许多好处,通过一个自底向上的方式连接字符。大部分文本数据集没有提供字符级的注释,而获取字符级的注释代价十分昂贵。
本文中提出了一个新颖的文本检测其定位单个字符区域,并将检测的字符连接成一个文本实例。
卷积神经网络 产生 字符区域得分 和关联得分。字符区域得分用于定位独立字符,关联的分将字符组成一个实例。
提出了一个弱监督框架,在现有的单词级的数据集上估计字符级的ground truths。
相关工作:
基于回归的文本检测器: TextBoxes DMPNet RSDD
基于分割的文本检测器: Multi-scale FCN,Holistic-prediction PixelLink SSTD TextSnake
端到端文本检测器:FOTS EAA MaskSpotter 识别模型有助于检测器更好的应对背景混乱。
大多数方法以单词为单位检测文本。单词的边界不能被严格定义,词语的注释模糊了ground truth的含义。
字符级的文本检测器:MSER,Seglink,Mask TextSpotter
灵感来源于WordSup,是一个弱监督架构用于训练字符级的文本检测器,然而一个劣势是WordSup中的字符表示是矩形框,容易受到透视形变的影响。且受主干架构的性能影响(使用SSD,anchor box的数量和大小被限制)。
方法:
我们方法的主要目的是在图像中准确地定位每一个字符。为此,我们训练了一个深度神经网络来预测字符区域和字符之间的关联。因为目前没有公开的字符级别的数据集,这个模型

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值