nanodet阅读：（2）正负样本定义(ATSS)

tang-shopping

已于 2022-06-25 11:07:29 修改

阅读量646

点赞数 1

分类专栏：经验记录文章标签：目标检测

于 2022-06-03 12:16:55 首次发布

本文链接：https://blog.csdn.net/tangshopping/article/details/125105996

版权

一、前言

本篇博客主要是ATSS部分，这部分个人认为是核心之一，毕竟正负样本的选择很重要，ATSS论文证实，anchor-based和anchor-free性能差异的根本原因在于正负样本的定义，好的正负样本定义方法能在很大程度上降低模型对Anchor Num, Anchor Size的依赖。这点在yolo v5上也得到了证实——“正确的正负样本定义方式能引入更多的高质量正样本，加快拟合并提高模型性能”。
首先推荐一个写的很好的 ATSS博客，看完它再看代码会清晰许多。以及我写的ATSS部分代码注释。

二、正文

根据代码总结的ATSS流程如下：

遍历每个ground truth，遍历每个输出层，找出每层前topk（超参，nanodet中是9）个L2距离（anchor和gt box中心点距离）最小的anchor。 nanodet一共3层输出层，则每个gt会匹配到27个候选anchor，输出数组shape=(27, gt_num)。这些anchor里可能会有重复，但是没关系，下面还有筛选措施；
计算每个gt和与之对应的27个anchor的IOU值，shape=(27, gt_num)(注意是与anchor左上右下的坐标做iou，不是和bbox，现在是给anchor做正负样本分类，还没到bbox呢)；
按列计算每个gt对应的27个IOU值的均值mean_IOU和标准差std_IOU，两者相加得到每个gt的自适应阈值，shape = (gt_num, );
从每个gt的27个anchor中筛选出IOU大于对应自适应阈值的anchor；
再计算每个anchor中心到其对应gt四条边界线的距离，取四个距离中的最小值，过滤掉最小值小于0.01的anchor，剩下的就是挑选出的正样本；
到这步时，可能有些anchor同时匹配了多个gt，此时需选出IOU值最大的那个gt作为匹配对象。即一个anchor只能匹配到一个gt，但是一个gt可以同时被多个anchcor匹配。