fast r-cnn算法流程可分为三步:
1.一张图生成1000~2000个候选区域(使用ss算法)
2.将图像输入到网络得到相应的特征图,将ss生成的候选框投影到特征图上获得相应的特征矩阵
3.将每个特诊矩阵通过ROI pooling层缩放到7*7大小的特征图,接着将特征图通过一系列全连接层得到预测结果。
与R-cnn的区别
R-cnn将所有的候选框缩放然后输入到网络中
ROI pooling
将特征图划分为7*7个小方格,对每一个小方格进行最大池化,这样特征图就缩放到了7*7大小(这里忽略了深度,其他深度也是相同的操作)
缩放到7*7大小之后经过拉平,两个全连接层,后续再并联两个全连接层一个是分类器,一个是别介狂回归器。