【正负样本选择】Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training(ATSS)

论文地址:https://arxiv.org/abs/1912.02424
代码地址:https://github.com/sfzhang15/ATSS
ATSS核心代码的解析可参考我写的这篇博客:https://blog.csdn.net/chenzhoujian_/article/details/109166250

摘要

论文中首先指出,基于锚框的检测和无锚检测的本质区别实际上是如何定义正负训练样本,从而导致它们之间的性能差异。
论文中提出了一种自适应训练样本选择(ATSS)的方法,根据对象的统计特征自动选择正样本和负样本。
论文最后讨论了在图像上每个位置平铺多个锚框来检测物体的必要性。

(一)RetinaNet与FCOS之间的差异

(1)每一位置平铺的锚的数量

RetinaNet每个位置平铺数个锚框,而FCOS每个位置一个锚点。

(2)正负样本的定义

RetinaNet:利用IoU将不同金字塔级别的锚框划分为正负样本。
具体做法:首先将每个物体的最佳锚框标记为正样本,然后将IoU>θp的锚框标记为正样本,将IoU< θn的锚框标记为负样本,最后其它锚框则在训练中忽略掉。
FCOS:利用空间和尺度约束从不同金字塔级别划分锚点。
具体做法:首先将对象真实框内的锚点作为候选正样本,然后根据每个金字塔级别定义的尺度范围从候选正样本中选择最终的正样本,最后那些未被选择的锚点即为负样本。
在这里插入图片描述

(3)回归的状态

RetinaNet从预设的锚框回归到对象边界框,而FCOS从锚点直接回归到对象边界框。
在这里插入图片描述

(二)自适应训练样本选择–ATSS

(1)具体过程:

1)对图像上的每一个真实框g,首先找到它的候选正样本。
在每一个金字塔级别上,根据L2距离选择其中心最接近真实框gk个锚框;假设有L个金字塔级别,则每个真实框gk×L个候选正样本。
2)计算这些候选正样本与真实框g之间的IoU作为Dg
3)计算Dg的均值mg和标准差vg
4)得到真实框gIoU阈值tg = mg + vg
5)最后选择候选正样本中IoU>=tg的锚框为正样本,同时限制正样本的中心位于真实框g中;另外,如果一个锚框被多个真实框选择,则分配给IoU最高的真实框。其余的锚框则标记为负样本。
在这里插入图片描述

(2)优势:

1)几乎没有超参数
之前的正负样本选择方法有许多敏感的超参数,例如基于锚框检测中的IoU阈值,基于无锚检测中的尺度范围。在设置这些超参数后,所有的真实框都必须根据固定的规则选择它们的正负样本,这些规则适用于大多数对象,但不适应一些例外对象。因此,这些超参数的不同设置将产生非常不同的结果。
ATSS只有一个超参数k,并且不敏感。
2)不同对象之间的公平性
RetinaNetFCOS策略往往对更大的对象有更多的正样本,导致不同对象之间的不公平。
统计结果表明,ATSS中,每个对象都有大约0.2kL的正样本,与其尺度、纵横比和位置无关。

结论

论文中指出了基于一级锚框检测和基于中心的无锚检测之间的本质区别实际上是正负训练样本的定义,并提出了一种自适应训练样本选择(ATSS)的方法,根据对象的统计特性自动划分正、负训练样本,从而弥合了基于锚框检测和基于无锚检测之间的差距。
论文中还讨论了在每个位置平铺多个锚的必要性,并得出了在ATSS的情况下,其并不是一个有效的操作的结论。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值