声明:所有图片均来自B站UP霹雳吧啦Wz,用作学习笔记
目录
一、R-CNN理论
1、引出
R-CNN可以说是利用深度学习进行目标检测的开山之作。作者Ross Girshick多次在PASCAL VOC的目标检测竞赛中折桂,曾在2010年带领团队获得终身成就奖。
2、R-CNN算法流程 -- 可分为4个步骤
-- 一张图像生成1K~2K个候选区域(使用Selective Search方法)
-- 对每个候选区域,使用深度网络提取特征(之前学习过的图像分类网络)
-- 特征送入每一类的SVM分类器,判别是否属于该类
-- 使用回归器精细修正候选框位置
3、R-CNN算法流程详细步骤
(1)候选区域的生成
利用selective Search算法通过图像分割的方法得到一些原始区域,然后使用一些合并策略将这些区域合并,得到一个层次化的区域结构,而这些结构就包含着可能需要的物体。
(2)对每个候选区域,使用深度网络提取特征
将2000候选区域缩放到227x227pixel(图片大小),接着将候选区域输入事先训练好的AlexNet CNN网络获取4096维的特征得到2000×4096维矩阵。
在图像分类的学习当中,在其分类网络进行卷积提取特征后进行展平操作,然后传入全连接层;而在这里是去掉了全连接层,获取候选区域的特征向量。
(3)特征送入每一类的SVM分类器,判定类别
将2000×4096维特征与20个SVM组成的权值矩阵4096×20相乘,获得2000×20维矩阵表示每个建议框是某个目标类别的得分。分别对上述2000 ×20维矩阵中每一列即每一类进行