Fast R_CNN
Fast R_CNN算法流程可分为3个步骤:
1)一张图生成1k~2k个候选框(使用Selective Search方法)
2)将图像输入网络得到响应的特征图,将SS算法生成的候选框投影到特征图上获得响应的特征矩阵
3)将每个特征矩阵通过ROI pooling层缩放到7x7大小的特征图,接着将特征图展平,通过一系列全连接层得到预测结果。注:ROI(Region of Interset)
1、一次性计算整张图像特征
R_CNN:依次将候选框区域输入卷积神经网络得到特征
Fast R_CNN将整张图像送入网络,紧接着从特征图像上提取相应的候选区域。这些候选区域的特征不需要再重复计算。且不再限制输入图像的尺寸。
2、数据采样
训练过程中并不是选用SS算法提供的所有候选框,只选用一小部分就可以,对于我们采集的候选框分为正样本和负样本,正样本(论文中IOU>0.5)指候选框中存在我们需要的物体,负样本指只有背景没有目标物体。
3、分类器
输出N+1个类别的概率(N为检测目标的种类,1为背景)共N+1个节点。
4、边界框回归器
输出对应N+1个类别的候选边界框回归参数(dx,dy,dw,dh),共(N+1)x4个节点。
5、Multi-task loss
其中,
当u>=1时,[u>=1]为1;当u<1时,[u>=1]为0.
6、fast R_CNN框架