Abstract
- 论文验证了造成anchor_base和anchor_free两种检测方法精度差异的原因:如何定义正负样本.
- 进而提出了Adaptive Training Sample Selection方法,根据样本特性动态调整正负样本的 IoU threshold.
- 验证了不需要在featurn map的每个位置设置多个anchor,单个anchor也不会掉点.
- 源码参考:https://github.com/sfzhang15/ATSS.
- 论文链接:https://arxiv.org/abs/1912.02424
Introduction
说明了anchor_base和anchor_free检测器的3个不同点,以RetinaNet和FCOS为例:
- 特征图上每一个位置的的anchor数目不同:RetinaNet多个anchor,FCOS只有1个point.
- 正负样本的定义方式不同:RetinaNet用IOU阈值来定义;FCOS利用空间位置和尺度来定义.
- dtbox回归方式不同:RetinaNet从anchor_box回归;FCOS从anchor_point回归.
Related Work
- 排除其他trik的影响,对RetinaNet和FCOS进行训练,精度如下,AP差异为0.8%

- 让RetinaNet和FCOS采用相同的正负样本采样的方式进行对比,精度结果如下:
同时采用IOU或者空间尺度信息会得到相同的效果,得出了造成anchor_base和anchor_free两种检测方法精度差异的原因:如何定义正负样本的结论.
除此之外,也尝试了从anchor_box和anchor_point进行回归,结论是精度无差异.

- 基于以上结论提出了 Adaptive Training Sample Selection,具体实现步骤如下图:

- 之前的正负样本选择方式(IOU或者空间尺度限制)都有超参数的限制,超参数的值会对检测器的结果造成很大影响,为了消除超参数的影响,提出了以上算法.
- k值的设定也是鲁棒的,从7-19,精度差异不大,完全可以认为是hyperparameter_free的,作者选择的值是9.
- 为什么IOU threshold = IOU均值+IOU标准差:
IOU的标准差是为了选择出最合适的FPN曾:标准差大就意味者存在一个特别适合的FPN曾用来检测次对象,小就意味着不存在.IOU均值是为了筛选个好的正样本出来,所以IOU阈值用了他们的和.

- 根据统计,正样本数量大概为0.2kL
- ATSS会提升大概2个点
