论文阅读 RefineDet

在这里插入图片描述
该算法可大致看作是SSD算法和RPN网络、FPN算法的结合,可以在保持SSD高效的前提下大大提高检测效果。

一、引入Two Stage类型目标检测算法中对Box由粗到细进行回归思想,即先通过RPN网络得到粗粒度的Box信息,然后再通过常规的回归支路进行进一步回归从而得到更加精确的框信息;

二、引入类似FPN网络的特征融合操作,可以有效提高对小目标的检测效果,检测网络的框架还是SSD。

网络结构主要包含三部分:ARM(Anchor Refinement Module),TCB(Transfer Connection Block),ODM(Object Detection Module)。

1 ARM

类似Faster RCNN算法中的RPN网络,主要用来得到Box(类似Faster RCNN中的ROI或Proposal)和去除一些负样本(这是因为负样本数量远大于正样本)。Two Stage类型算法效果优于One Stage的一个重要原因就是采用了这种先提取粗粒度Box然后进行进一步回归的思想。

ARM旨在移除负样本anchors以便为分类器减少搜索空间,并粗略调整 anchors 的位置和大小,以便为随后的回归器提供更好的初始化结果

2 TCB

详细结构如下图所示。该部分主要负责特征的转换和融合,类似FPN。讲ARM部分输出的Feature Map转换成ODM部分的输入。TCB通过进行特征层的融合,将高语义层上采样(通过反卷积实现)与上一层进行融合,提高底特征层的语义信息。

TCB传输anchor细化模块中的特征,一边可在ODM中预测目标的位置、尺寸和类别标签。TCB的另一个功能是通过将高级特征添加到传输的特征来继承大规模的上下文,以提高检测的准确性。如图2,为了让他们之间的维度相匹配,我们使用逆卷积操作来增大高级特征图,并把它们的对应元素进行求和。然后,我们在求和之后添加卷积层以确保检测的特征的可辨性。

3 ODM

该部分基本上借鉴自SSD。不同的地方在于该部分的Anchors是ARM部分得到的Refined Anchors,Feature Map来自TCB得到的融合了各层的多语义Feature Map(可大幅度提高小目标物体的检测效果)。

为了在 ARM 和 ODM 之间建立链接,我们引入了 TCB(传输连接块)将来自 ARM 的不同层的功能转换为 ODM 所需的形式,以便 ODM 可以共享来自 ARM 的特征。
ODM 旨在根据细化后的 anchors 将结果回归到准确的目标位置并预测多类别标签
ODM 由TCB 的输出组成,TCB后面连接着预测层,其生成目标类别的分数和相对于细化后的 anchors 的坐标的形状偏移量

RefineDet 是基于SSD算法的改进。继承了两种方法(例如,单一阶段设计方法,两阶段设计方法)的优点,并克服了它们的缺点。它改进了采用单一阶段设计的方法,使用两个相连的模块(见图1),即 anchor 细化模块(the anchor refinement module,ARM)和目标检测模块(the object detection module,ODM)。

两步级联回归策略来回归目标的位置和大小。也就是说,我们使用ARM 来首次调整 anchors 的位置和大小,以便为ODM 中的回归操作提供更好的初始化结果。具体而言,我们将 n 个 anchor boxes 与特定特征图上的每个规则划分的单元相互关联。每个 anchor box 相对于其对应单元的初始位置是固定的。对于每个特征图单元,我们预测经过细化的 anchor boxes相对于原始平铺 anchors 的四个偏移量以及便是这些框中存在前景对象的两个置信度分数。因此,我们可以在每个特征图单元中生成 n 个细化后anchor boxes。

损失函数

在这里插入图片描述
Narm和Nodm分别指的是ARM和ODM中正样本anchors的数目,pi指的是预测的anchor i是一个目标的置信度,xi指的是ARM细化后预测的anchor i的坐标,ci是ODM中预测的bbox的物体类别,ti是ODM中预测的bbox坐标,li是anchor i真实的类别标签,gi是anchor i真实的位置和大小。

  1. https://blog.csdn.net/qq_34199326/article/details/84110393
  2. https://zhuanlan.zhihu.com/p/50916833
  3. https://zhuanlan.zhihu.com/p/50243277
  4. http://www.baiyifan.cn/2019/03/10/RefineDet/
  5. https://hellozhaozheng.github.io/z_post/计算机视觉-RefineDet-CVPR2018/
  6. https://zhuanlan.zhihu.com/p/39184173
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值