目标检测中样本一般就是回归分支给出的检测框,例如anchor-based的代表方法faster-rcnn系列和yolo系列都会在任务开始前定义anchor,双阶段的rcnn系列网络会在rpn网络之后给出proposals,yolo会事先对每个像素点设定anchor的比例和数量。网络最后输出的检测框就是样本。
正负样本:算法会事先约定一个iou的阈值,检测框与label的iou大于该阈值认为是正样本,小于则是负样本
难易样本:对于正样本中预测概率较高的说明是易分样本,负样本中预测概率较低的也是易分样本。因为这些框很容易被正确分类。但对于正样本中预测概率不高的,负样本中预测概率较高的都是难分样本,这类样本很难被正确分类。
事实上,在目标检测领域正负样本的定义策略是不断变化的,例如现在流行的anchor-free的算法fcos,采用的是逐像素预测,只要像素点落在gt框内,该点回归出来的检测框就是正样本。正负样本的定义策略也直接影响了算法的效果好坏。通过loss提高难分正样本的影响权重不如从定义策略上下手,从根源解决问题。ATSS证实了该想法是有效的,但往往一些定义策略解决了正负样本以及难易样本的不均衡问题,却又无法在其他方面兼得。比如检测框的质量,预测出来的概率的可信度都受到影响。