文章是对博主视频讲解的一些总结。
博主链接:https://blog.csdn.net/qq_37541097?spm=1001.2014.3001.5509
1 fast R-CNN简述
模型backbone同样和R-CNN一样是使用VGG16。同样也是出自作者Ross Girshick之手。效果肯定比R-CNN好,不然也不会发。
2 算法流程
算法主要分为3个步骤:
- 一张图像生成1K~2K 个候选区域(使用SS算法)
- 将图像喂入CNN得到特征图,再将上步得到的选取框投影到特征图上,得到特征矩阵
3.将特征矩阵通过ROI pooling 层缩放7x7大小的特征图并且紧接着将其展平成一维的向量送给FC,得到预测结果。
2.1 区别
- 在R-CNN中依次将候选框喂给CNN得到特征
- 在fast R-CNN中将原图像送给CNN,紧接着从特征图像上提取相应的候选框。