[AutoAssign]AutoAssign: Differentiable Label Assignment for Dense Object Detection

AutoAssign是一种用于密集目标检测的差异化标签分配方法,通过数据驱动和外观感知权重机制优化空间和尺度任务。它提出中心加权和置信度加权策略,改进了现有方法中正负样本的选择,适用于FCOS等锚点自由检测器。该方法在COCO和其他数据集上表现出色。
摘要由CSDN通过智能技术生成

paper:https://arxiv.org/abs/2007.03496
code:https://github.com/Megvii-BaseDetection/AutoAssign


文中对于Label; Assignment的定义:

Determining positive/negative samples for object detection is known as label assignment.

1. Motivation

目前主流的label assignmnet方法主要分为2种:
(1)Anchor-Based Detectors 如RetinaNet是在每一个位置上准备了多种尺度以及比例的anchor,并且使用IOU来对正负样本进行resort;
(2) Anchor-Free Detectors 如FCOS,对于每一个object选取一个固定的中心区域的部分作为正的空间位置,并且通过FPN的尺度限制,来选择每个特定的FPN的stage上的正样本。
这些center prior方法在主流数据集上表现优异,但是在现实生活,对于香蕉以及雨伞等类别,这种采样方法可能就会选择到object外的location,就无法涵盖了类别的多样性分布。

the diverse distributions of categories

近期的一些研究中,如GuidedAnchoring和MetaAnchor在采样前动态的改变anchor shape的先验知识。ATSS,FreeAnchor等方法自适应对每一个object的spatial维度以及scale维度进行建模。
然而,这些方法只能在部分的label assignment实现data-driven。其他部分还是需要人的先验设置,阻止了label assignmnet的进一步优化。作者基于以下的直观想法为动机:

Intuitively, sampling locations on objects is better than background because they are prone to generate higher quality proposals. Motivated by this, we present Auto-Assign, which makes label assignment fully data-dependent and appearance-aware.

2. Contribution

作者认为的3个方面的贡献:
(1)提出了一种外观识别和完全可微分(differentiable)的标签分配加权机制。,它使spatial和scale任务得以统一的优化。

The entire process of weighting is differentiable and can be conveniently optimized by back-propagation during training.

(2)提出了2种权重模型(Center Weighting 和 Confidence Weighting)以在空间和尺度维度上调整特定类别(category-specific)的先验分布和特定实例(instances-specific)的采样策略。
(3)Auto-Assgin在MS COCO上得到COCO,在其他的数据集如PASCAL VOC等数据集也有很强大的竞争力。

3. Method

采用anchor-free的FCOS结构,去除了预定义的anchors并且直接在每一个特征的位置上预测物体。
网络会输出三个直,classification score,localization offsets和implicit-objectness score。

在这里插入图片描述

AutoAssign的网络结构以及训练时的样本选取策略

3.1 Prior-level : Center Weighting

G ( d ⃗ ∣ μ ⃗ , σ ⃗ ) = e − ( d ⃗ − μ ⃗ ) 2 2 σ ⃗ 2 (1) G(\vec d| \vec \mu, \vec \sigma )= e^{\frac{-(\vec d - \vec \mu)^2}{2\vec \sigma^2}} \tag {1} G(d μ ,σ )=e2σ 2(d μ )2(1)
G是一种基于类别的高斯形式的权重函数。这个中心加权模块保证了越靠近bbox中心的location会拥有更高的weights,而距离越远则weights会越低。
其中, d ⃗ \vec d d 表示在沿x和y方向上,在一个物体的内部的确定位置,相对于它自己box center的偏移。 μ ⃗ \vec \mu μ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值