Faster RCNN
动机
Fast RCNN虽然对于检测的速度已经接近于达到实时,但是候选区域的提取方法依然是依赖于传统的算法例如选择性搜索,而选择性搜索在CPU上要实现一张图像的候选区域提取需要达到2秒,显然是非常耗时的。
而GPU可以达到加速网络计算的速度,因此想到利用GPU加速的网络来代替传统的算法从而实现候选区域的提取过程。于是提出RPN(区域提取网络),并且该网络可以和卷积网络共享参数计算,因此消耗的时间非常少。
主要创新点
RPN
RPN就是区域提取网络,也就是代替传统的选择性搜索等算法来实现候选区域的提取部分,对于输入图像首先进行卷积运算,文中用到的ZF和VGG网络,得到HxWx256维度的特征图(ZF,VGG是512维),之后对于HxW特征图进行3x3的滑窗,得到256维特征向量,也就是对于特征图上3x3滑动窗口区域乘上3x3x256x256四维的卷积核,之后对于256维特征向量分别喂给两条分支,一条分类分支,一条边框分支,其中分类分支负责判定该区域是否存在目标,判定前景和背景,而边框回归分支用来修正原始粗略选取的目标区域。最后通过RPN生成大约2000个候选区域,再通过NMS算法筛选出其中的300个,对于每个候选区域进行ROI池化后再进行分类和边框回归(Fast R