Fast R-CNN算法

最新推荐文章于 2021-06-05 21:18:38 发布

大彤小忆

最新推荐文章于 2021-06-05 21:18:38 发布

阅读量3.7k

点赞数 2

分类专栏：深度学习目标检测文章标签： Fast R-CNN 卷积神经网络目标检测

本文链接：https://blog.csdn.net/HUAI_BI_TONG/article/details/112152175

版权

目标检测同时被 2 个专栏收录

14 篇文章 14 订阅

订阅专栏

深度学习

7 篇文章 5 订阅

订阅专栏

Fast R-CNN算法是作者Ross Girshick对R-CNN算法的一种改进。R-CNN虽然取得了不错的成绩，但是其缺点也很明显。Fast R-CNN同样使用VGG-16网络结构，与R-CNN相比训练时间快9倍，测试时间快213倍，准确率从62%提升至66%(再Pascal voc数据集上)。Fast R-CNN主要是解决R-CNN存在的问题：

测试训练速度慢，主要是提取候选区域的特征慢：R-CNN首先从测试图中提取2000个候选区域，然后将这2000个候选区域分别输入到预训练好的CNN中提取特征。由于候选区域有大量的重叠，这种提取特征的方法，就会重复的计算重叠区域的特征。在Fast-RCNN中，将整张图输入到CNN中提取特征，在邻接时再映射到每一个候选区域，这样只需要在末尾的少数层单独的处理每个候选框。
训练需要额外的空间保存提取到的特征信息：R-CNN中需要将提取到的特征保存下来，用于为每个类训练单独的SVM分类器和边框回归器。在Fast R-CNN中，将类别判断和边框回归统一的使用CNN实现，不需要再额外的存储特征。

Fast R-CNN算法步骤：

输入一张图像生成1K~2K个候选区域(使用Selective Search方法)；
将图像输入网络得到相应的特征图，将Selective Search算法生成的候选框投影到特征图上获得相应的特征矩阵；
将每个特征矩阵通过ROI pooling层缩放为7x7大小的特征图，接着将特征图展平通过一系列全连接层得到预测结果。

在这里插入图片描述
关于Fast R-CNN的几个点：

一次性计算整张图像特征：R-CNN依次将候选框区域输入卷积神经网络得到特征；Fast R-CNN将整张图像输入网络，紧接着从特征图像上提取相应的候选区域，这些候选区域的特征不需要再重复计算。
ROI 池化层
分类器和边界框回归器
Multi-task loss： $t^{u}, v)=L_{cls}(p, u)+ \lambda[u\geqslant 1]L_{loc}(t^{u}, v)$