- 第一大类是 从非Deep时代就被广泛应用的dense detector ,例如DPM,YOLO,RetinaNet,FCOS。在dense detector中,大量的object candidates例如sliding-windows,anchor-boxes, reference-points等被提前预设在图像网格或者特征图网格上,然后直接预测这些candidates到gt的scaling/offest和物体类别。
- 第二大类是 dense-to-sparse detector ,例如R-CNN家族。这类方法的特点是对一组sparse的candidates预测回归和分类,而这组sparse的candidates来自于dense detector。
- 彻底的sparse框架,例如:Sparse R-CNN
detector
dense detector
在Focal Loss for Dense Object Detection 这篇文章中有提到dense object detection。
anchor在图像上每一个位置密集地平铺,进而采集各种尺寸、大小比例的样本,采集到的这些样本不会经过过滤,而是无差别地送入分类器(区分前后景)和回归器(回归精确位置)进行处理。根据这个特征,目前大部分的一阶段检测器都是dense object detector。
dense-to-sparse detector
二级检测器在第一阶段会精选出高质量的样本(数量远远小于一级检测器的样本,一般数量在1-2k),然后再送入第二阶段的模型中进行分类和回归。所以一般二级检测器为非dense object detector。