R-CNN -> Fast R-CNN -> Faster R-CNN
RCNN:
- 通过SS算法对一张图生成1k~2k个候选区域
- 对每个区域进行深度神经网络提取特征
- 再将特征送入每一类的SVM分类器,判别是否属于该类
- 使用回归器精细修正候选框的位置
Fast R-CNN:
- 通过SS算法对一张图生成1k~2k个候选区域
- 将图像输入网络得到对应的特征图,将SS算法生成的候选区域投影到特征图上获得相应的特征矩阵
- 将每个特征矩阵通过ROI pooling层缩放到7X7大小的特征图,接着将特征图展平,通过一系列全连接层得到预测结果
Faster R-CNN: - 将图像输入网络得到相应的特征图
- 使用RPN结构生成候选框,将RPN生成的候选框投影到特征图上获得相应的特征矩阵
- 将每个特征矩阵通过ROI pooling层缩放到7X7大小的特征图,接着将特征图展平,通过一系列全连接层得到预测结果
Faster R-CNN = RPN + Fast R-CNN