Fast R-CNN的学习笔记

最新推荐文章于 2020-06-25 16:20:19 发布

VIP文章树朴

最新推荐文章于 2020-06-25 16:20:19 发布

阅读量261

点赞数

分类专栏：深度学习文章标签： Fast R-CNN multi-task ROI-pooling SVD Smooth L1

本文链接：https://blog.csdn.net/yjjgoodbay/article/details/102652280

版权

在学习了R-CNN之后，我又迫不及待的学习了它的改良版Fast R-CNN，现在拿出来和大家进行分享~

R-CNN的横空出世将深度卷积神经网络带进了目标检测领域。虽然R-CNN在此方面取得了不错的成绩，但也有些问题亟需解决。

针对上述问题，Fast-RCNN的作者创造性的提出一些解决方案，在大大加快训练和测试的速度之外，准确性也得到了提升。

针对问题1，R-CNN是先提议候选框，将候选框裁剪后送至CNN提取特征。Fast-RCNN充分利用卷积操作的共享性，将图片先送至CNN提取特征，在这个特征上加入位置信息。
针对问题2和问题3，R-CNN将用于分类的SVM和用于定位的bbox regression二者合并在一个网络之中，将特征送至两个并行的全连接层（multi-task），其中一个后接SoftMax用来预测类别，另一个后接bbox regression来定位边界框。同时作者提出了ROI-pooling的操作，使得从卷积层提取出来特征建议框的尺寸得以统一，以便传入后序的全连接层。这个操作使得

关注