DAY-2 目标检测的多尺度检测
原文连接:https://bbs.cvmart.net/articles/125
-
YOLOV1
每层使用同样大小的卷积窗口, 识别超大或超小物体就变得无能为力(最后一层的输出特征图是固定7*7)
-
SSD
最后一层的检测是由之前多个尺度(Multi-Scale)的特征图共同生成的,在多尺度物体的检测上有所提高,但最后几层的所谓“多尺度”是有限的,特征图尺寸越小,可识别的物体越大,对极小目标识别无能为力
-
FPN(特征金字塔网络)
从顶层(自上而下)的每一层都进行上采样获取更准确的像素位置信息,但计算量增多
-
SNIPER
对每个尺度大类下都维护一个重点关注区域(region),还在重点关注区域中加入了重点排除区域,因为在许多背景中,许多目标是无须识别的。与FPN不同的是,SNIPER不再需要处理每一层特征图的像素进行上采样,计算量下降了不少。对于较简单图像,SNIPER理论上应该允许退化到类似yolo的one shot模型(通过维护的重点关注区域)。在实现上,SNIPER在RPN网络和Faster-RCNN中都用到了重点关注区域。