Faster RCNN理论合集
https://www.bilibili.com/video/BV1af4y1m7iL/?spm_id_from=333.337.search-card.all.click
一、R-CNN
论文地址:[1311.2524] Rich feature hierarchies for accurate object detection and semantic segmentation
1.算法流程
-
一张图像生成1k~2k个候选区域(使用Selective Search方法)
-
对每个候选区域,使用深度网络提取特征
-
特征送入每一类的SVM分类器,判别是否属于该类
-
使用回归器精细修正候选框位置
2.存在问题
-
测试速度慢(一张图像内候选框之间存在大量重叠)
-
训练速度慢
-
训练所需空间大
二、Fast R-CNN
相比R-CNN训练速度更快、推理速度更快,更加准确
1.算法流程
-
一张图像生成1k~2k个候选区域(使用Selective Search方法)
-
将图像输入网络得到相应的特征图,将SS算法生成的候选框投影到特征图上获得相应的特征矩阵
-
将每个特征矩阵通过ROI pooling层缩放到7*7大小的特征图,接着将特征图展平通过一系列全连接层得到预测结果(ROI Regin of Interst)