链接
论文地址:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection
github地址:ATSS
文章创新点
本文主要是通过对目标检测中的正样本的重新定义,通过重新定义的正样本来训练模型,最终使得模型能更好的学习到主要的特征。所以无需对模型本身做任何的修改,也无需对训练过程进行任何修改,只需调整输入到模型中的样本。
详细解读
论文主要阐述了对于正负样本的定义和选取对模型最终效果的影响。
首先是对比了anchor_free和anchor_base在选取样本时的差异,本文以RetinaNet和FCOS作为例子进行了对比,RetinaNet是采用IOU去选取正负样本,FCOS是基于空间分布对正负样本进行score。这两种采样方式会导致最终训练的正负样本是不一致的,作者通过对ReinaNet用两种不同采样方式进行训练模型,并对比起在COCO上的AP,验证anchor_base和anchor_free本质上的区别只是在于采样的不同。
regression | Box | Point |
---|---|---|
Intersection over Union | 37.0 | 36.9 |
Spatial and Scale Constraint | 37.8 | 37.8 |
然后提出本文的思想,自适应的选取正样本的方法,同时结合了上述两种的选取正样本方法,具体方法如下:
1.对于每个输出的检测层,选计算每个anchor的中心点和目标的中心点的距离,选取K个anchor中心点离目标中心点最近的anchor为候选正样本(candidate positive samples)
2.计算每个候选正样本和groundtruth之间的IOU,计算这组IOU的均值和方差
3.根据方差和均值,设置选取正样本的阈值:t=m+g m为均值,g为方差。
4.根据每一层的t从其候选正样本中选出真正需要加入训练的正样本。
5.训练模型。
本文的方法主要有两大特性:
1.保证了所有的正样本anchor都是在groundtruth的周围。
2.最主要是根据不同层的特性对不同层的正样本的阈值进行了微调。
作者采用本方法与之前的提取正负样本的训练方法进行了对比
(未完待续)
</div>
<link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-b6c3c6d139.css" rel="stylesheet">
<div class="more-toolbox">
<div class="left-toolbox">
<ul class="toolbox-list">
<li class="tool-item tool-active is-like "><a href="javascript:;"><svg class="icon" aria-hidden="true">
<use xlink:href="#csdnc-thumbsup"></use>
</svg><span class="name">点赞</span>
<span class="count"></span>
</a></li>
<li class="tool-item tool-active is-collection "><a href="javascript:;" data-report-click="{"mod":"popu_824"}"><svg class="icon" aria-hidden="true">
<use xlink:href="#icon-csdnc-Collection-G"></use>
</svg><span class="name">收藏</span></a></li>
<li class="tool-item tool-active is-share"><a href="javascript:;" data-report-click="{"mod":"1582594662_002"}"><svg class="icon" aria-hidden="true">
<use xlink:href="#icon-csdnc-fenxiang"></use>
</svg>分享</a></li>
<!--打赏开始-->
<!--打赏结束-->
<li class="tool-item tool-more">
<a>
<svg t="1575545411852" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="5717" xmlns:xlink="http://www.w3.org/1999/xlink" width="200" height="200"><defs><style type="text/css"></style></defs><path d="M179.176 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5718"></path><path d="M509.684 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5719"></path><path d="M846.175 499.222m-113.245 0a113.245 113.245 0 1 0 226.49 0 113.245 113.245 0 1 0-226.49 0Z" p-id="5720"></path></svg>
</a>
<ul class="more-box">
<li class="item"><a class="article-report">文章举报</a></li>
</ul>
</li>
</ul>
</div>
</div>
<div class="person-messagebox">
<div class="left-message"><a href="https://blog.csdn.net/ckqsars">
<img src="https://profile.csdnimg.cn/4/D/2/3_ckqsars" class="avatar_pic" username="ckqsars">
<img src="https://g.csdnimg.cn/static/user-reg-year/1x/8.png" class="user-years">
</a></div>
<div class="middle-message">
<div class="title"><span class="tit"><a href="https://blog.csdn.net/ckqsars" data-report-click="{"mod":"popu_379"}" target="_blank">ckqsars</a></span>
</div>
<div class="text"><span>发布了18 篇原创文章</span> · <span>获赞 2</span> · <span>访问量 2万+</span></div>
</div>
<div class="right-message">
<a href="https://im.csdn.net/im/main.html?userName=ckqsars" target="_blank" class="btn btn-sm btn-red-hollow bt-button personal-letter">私信
</a>
<a class="btn btn-sm bt-button personal-watch" data-report-click="{"mod":"popu_379"}">关注</a>
</div>
</div>
</div>