R-CNN详解:
简要概述:R-CNN由五部分组成,分别是候选区域生成、CNN网络特征提取、特征向量训练分类器SVM、非最大抑制(NMS)、候选区域回归,下面将一一介绍这五个部分
1.候选区域(Region of interest)生成
R-CNN候选区域生成是通过选择搜索(Selectve Search)算法将一张图片分割为2000个大小不等的候选区域,选择性搜索算法基本思想是:首先将每个像素作为一组,计算每一组的纹理,并将两最接近的组结合起来。但是为了避免单个区域吞噬其他区域,我们首先对较小的组进行分组。我们继续合并区域,直到所有区域都结合在一起,下图第一行展示了如何使区域增长第二行中的蓝色矩形代表合并过程中所有可能的ROI。(简单理解即可)
2.CNN网络提取征
R-CNN使用AlexNet网络提取特征,由1中分割得到的2000张大小不等的候选区域,无法直接进行特征提取,需要根据的特征提出网络对应要求,对图片进行大小变换之后输入网络进行特征提取,得到2000个Feature map,如下图。