【论文阅读】Region Proposal by Guided Anchoring

论文地址:https://arxiv.org/abs/1901.03278v2

代码地址: mmdetection (https://github.com/open-mmlab/mmdetection)

论文看了,很好,有空再补笔记。 (已补,也不算原创吧,作者介绍的,我标记注释自己理解的。)

RPN(笔记:https://blog.csdn.net/m0_37644085/article/details/95005141)缺点/难点:

该方案有两个难点:

(1)对于不同的问题,必须预先定义一组固定高宽比的锚固,这种手工挑选的先验不现实地为物体设定了一套固定的形状(即比例和高宽比)。错误的设计可能会影响探测器的速度和精度。

(2)为了保持对提案的足够高的召回率,(单阶段、两阶段和多阶段)仍然依赖于滑动窗口的密集和均匀的锚框,即需要大量的锚,这些锚框是均匀分布的,许多锚被放置在不太可能存在感兴趣对象的区域,对应的是与感兴趣目标区域无关的负样本候选框。

同时,大量的锚固会导致大量的计算量,特别是当算法基线在proposals分类阶段,box分类阶段如faster rcnn有两个fc,会导致非常大的计算量。

这是作者写的介绍,我先记录下,有空再补吧:(已补)

https://zhuanlan.zhihu.com/p/55854246

前言

"Region Proposal by Guided Anchoring"。这篇 paper 的方法用在了 COCO Challenge 2018 检测任务的冠军方法中,在极高的 baseline 上涨了1个点。最近公开在 ArXiv 上,欢迎大家提出意见。

概述

我们提出了一种新的 anchor 生成方法 —— Guided Anchoring,即通过图像特征来指导 anchor 的生成。通过预测 anchor 的位置和形状,来生成稀疏而且形状任意的 anchor,并且设计了 Feature Adaption 模块来修正特征图使之与 anchor 形状更加匹配。在使用 ResNet-50-FPN 作为 backbone 的情况下,Guided Anchoring 将 RPN 的 recall(AR@1000) 提高了 9.1 个点,将其用于不同的物体检测器上,可以提高 mAP 1.2 到 2.7 个点不等。

下图是我们的方法和传统 RPN 的性能和速度对比,可以看到要显著优于传统 RPN。

下面是应用在不同检测方法上的结果,backbone 均为 ResNet-50-FPN。

背景

Anchor 是物体检测中的一个重要概念,通常是人为设计的一组框,作为分类(classification)和框回归(bounding box regression)的基准框。无论是单阶段(single-stage)检测器还是两阶段(two-stage)检测器,都广泛地使用了 anchor。例如,两阶段检测器的第一阶段通常采用 RPN 生成 proposal,是对 anchor 进行分类和回归的过程,即 anchor -> proposal -> detection bbox;大部分单阶段检测器是直接对 anchor 进行分类和回归,也就是 anchor -> detection bbox

常见的生成 anchor 的方式是滑窗(sliding window),也就是首先定义 k 个特定尺度(scale)和长宽比(aspect ratio)的 anchor,然后在全图上以一定的步长滑动。这种方式在 Faster R-CNN,SSD,RetinaNet 等经典检测方法中被广泛使用。

Motivation

通过 sliding window 生成 anchor 的办法简单可行,但也不是完美的,不然就不会有要讲的这篇 paper 了。首先,anchor 的尺度和长宽比需要预先定义,这是一个对性能影响比较大的超参,而且对于不同数据集和方法需要单独调整。如果尺度和长宽比设置不合适,可能会导致 recall 不够高,或者 anchor 过多影响分类性能和速度。一方面,大部分的 anchor 都分布在背景区域,对 proposal 或者检测不会有任何正面作用;另一方面,预先定义好的 anchor 形状不一定能满足极端大小或者长宽比悬殊的物体。所以我们期待的是稀疏,形状根据位置可变的 anchor。

Formulation

首先我们思考 anchor 是如何生成的。我们通常使用 4 个数 (x, y, w, h) 来描述一个 anchor,即中心点坐标和宽高。我们将 anchor 的分布 formulate 成如下公式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值