朝着实时目标检测器迈进的区域监测网络
ssd(实现了实时检测)是借鉴faster-RCNN :高级特征图上利用anchor选择建议区域,进行分类回归;ssd无全连接,faster-RCNN有全连接。
目标检测回顾
原始图像(low-level)
高级特征(high-level)进行图像分类效果好
1、对比RCNN、Faster-RCNN:
(1) RCNN:在原始图像提取框,精度低
(2) Faster-RCNN:在高级特征图做区域建议,使分类精度和边框回归更精确
2、对比RCNN(0.07帧/s)、Fast-RCNN(0.5帧/s):
(1) Fast-RCNN使用ROI池化增速,其余与RCNN相同
(2) Fast-RCNN过程:在原图进行区域建议框搜索(Selective Search ),将框放入CNN中,(池化用ROI),输出
3、对比Fast-RCNN(end-to-end:输入原图,输出坐标值(one-stage一步法))、Faster-RCNN:
(1) Faster-RCNN(Fast+RPN):保留Fast-RCNN的框架,加入RPN。
(2) 改进:
a. 取消了在原图上SS,在高级特征图区域建议,使分类数量减少。
b. 增加RPN
4、 ROI池化(下采样):简化版SPPNet(空间金字塔池化)
稳定性高(鲁棒性),保留原图信息
5、 对比RPN、Selective Search
RPN:在featuremap提取区域建议
Selective Search:在原图提取区域建议
6、计算公式
RCNN+SPPNet(ROI池化) = Fast-RCNN
Fast-RCNN+RPN-SS = Faster-RCNN
RCNN+SPPNet(ROI池化)+RPN-SS = Faster-RCNN
SPP-Net和Faster—RCNN简介
1、为什么提出 SPP-Net
R-CNN图片输入尺寸必须固定,会造成图片信息丢失或扭曲
SPP-Net目的:输入任何储存图片,保留图片原始信息,并且保证conv layer输出和fc-layer输入的神经元个数相等
SPP-Net核心:
1、保证任意尺寸输入
2、保证小物体的检测效果
2、RPN????????????
Faster-RCNN研究背景
前期知识储备
目标检测三阶段:
1、区域建议:原图SS、特征图上做
2、特征提取:VGG ResNet AlexNet
3、分类回归:损失函数构造(预测坐标点、预测坐标点相对偏移量)