ATSS:Adaptive Training Sample Selection

本文提出了一种基于目标统计特性的无超参数自动划分正样本和负样本的ATSS方法。算法1描述了该方法如何对输入图像进行处理。对于图像上的每个ground-truth box g g g,我们首先找出它的候选正样本(positive)。如第3 - 6行所述,在每个金字塔层级上,我们根据L2距离选择中心最接近 g g g的中心的 k k k个锚盒(anchor box)。假设存在 L L L个特征金字塔水平,则ground-truth box g g g将有 k × L k×L k×L候选正样本。在此之后,我们在第7行计算这些候选正样本与ground-truth box g g g之间的IoU, D g D_g Dg,其均值和标准差计算为 m g m_g mg v g v_g vg,在第8行和第9行。根据这些统计数据,这个ground-truth box g g g的IoU阈值在第10行为 t g = m g + v g t_g = m_g+v_g tg=mg+vg。最后,我们选择IoU大于或等于阈值 t g t_g tg的候选框作为最终正样本,在第11 - 15行。值得注意的是,我们还将正样本的中心限制在ground-truth box中,如第12行所示。此外,如果将一个锚盒分配给多个ground-truth box,则将选择IoU最高的那个。其余为负样本。我们的方法背后的一些动机如下所述。
在这里插入图片描述
根据anchor box与目标之间的中心距离选择候选对象。 对于RetinaNet,当锚盒中心更靠近物体中心时,IoU更大。对于FCOS,锚点离目标中心越近,检测质量越高。因此,离物体中心越近的锚是更好的选择。
使用均值和标准差之和作为IoU阈值。 一个目标的IoU平均值 m g m_g mg是对该目标的预置锚点的适用性的度量。如图3(A)所示,高的 m g m_g mg表示它有高质量的候选对象,IoU阈值应该是高的。如图3(b)所示,低的 m g m_g mg表示它的大多数候选锚点都是低质量的,IoU阈值应该是低的。此外,对象的IoU标准差 v g v_g vg是判断哪些层适合检测该对象的指标。图3(a)所示的高 v g v_g vg意味着有一个最适合此目标的金字塔级别,将 v g v_g vg添加到 m g m_g mg可以获得一个高阈值,仅从该级别选择阳性结果。图3(b)所示的低 v g v_g vg意味着有一些适合这个对象的金字塔级别,向 m g m_g mg添加 v g v_g vg可以获得一个低阈值来从这些级别选择适当的正样本。利用均值 m g m_g mg和标准偏差 v g v_g vg的和作为IoU阈值 t g t_g tg,可以根据对象的统计特征,自适应地从适当的金字塔水平上为每个对象选择足够多的正样本。
将正样本的中心限制在目标上。 具有中心在物体外的锚点是较差的候选框,会被物体外的特征所预测,不利于训练,应予以排除。
维护不同对象之间的公平性。 根据统计理论,约有16%的样本处于置信区间 [ m g + v g , 1 ] [m_g + v_g,1] [mg+vg,1]理论。虽然候选对象的IoU不是一个标准的正态分布,但统计结果表明,每个对象约有 0 : 2 ∗ k L 0:2 * kL 0:2kL的正样本,其大小、长宽比和位置是不变的。相比之下,RetinaNet和FCOS的策略对于较大的对象往往具有更多的正样本,导致不同对象之间的不公平。
保持尽可能无超参数。 在我们的方法中只有一个超参数k。后续的实验将证明它对k的变化相当不敏感,所提出的ATSS可以被认为是无参数的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值