Single Shot Text Detector with Regional Attention论文翻译

摘要

我们提出了一个新型的单镜头文本检测器,它直接在一张自然图片中输出单词级别的包围盒。我们提议了一种注意力机制,它可以通过一种自动学习注意力的图来大致上识别出上下文区域。这种方法基本上抑制了在卷积特征上的背景干扰,这是产生单词精确推断的关键,尤其是在一个非常小的尺度上。这就导致了一个根本上以由粗到细的方式运行的单一模型。这背离了最近基于FCN的串联多个FCN模型来获得一个精确的预测的文本检测器。此外,我们开发了一个分级起始模块,它可以有有效地聚集多个尺度的起始特征,这就加强例如本地细节,同时编码强壮的上下文信息

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值