Fast R-CNN

最新推荐文章于 2019-02-11 10:54:30 发布

张家坎

最新推荐文章于 2019-02-11 10:54:30 发布

阅读量198

点赞数

分类专栏：论文阅读

本文链接：https://blog.csdn.net/u014236392/article/details/86771417

版权

论文阅读专栏收录该内容

12 篇文章 0 订阅

订阅专栏

Fast R-CNN是针对R-CNN和SPPnet的改进，通过RoI池化层实现了更快的检测速度和更高的精度。它采用多任务损失的单阶段训练，更新所有网络层参数，并且不需要缓存特征。然而，由于依赖selective search，其仍存在非端到端训练的问题。

摘要由CSDN通过智能技术生成

首页：https://blog.csdn.net/u014236392/article/details/86767950
论文：Fast R-CNN
official code - caffe：https://github.com/rbgirshick/fast-rcnn

1.

检测要求的精确定位目标导致复杂性产生，其中两个主要挑战是：
（1）必须处理大量候选目标区域（proposals）；
（2）这些候选框只提供了粗略定位，必须进行精修来精准定位。而解决这些问题的办法往往牺牲了速度、准确率或者简易性。

1.1 R-CNN and SPPnet

① 训练过程是多级流水线。R-CNN首先使用目标候选框对卷积神经网络使用log损失进行微调。然后，它将卷积神经网络得到的特征送入SVM。这些SVM作为目标检测器，替代通过微调学习的softmax分类器。在第三个训练阶段，学习检测框回归。
② 训练在时间和空间上是的开销很大。对于SVM和检测框回归训练，从每个图像中的每个目标候选框提取特征，并写入磁盘。
③ 目标检测速度很慢。在测试时，从每个测试图像中的每个目标候选框提取特征。
R-CNN很慢是因为它为每个目标候选框进行卷积神经网络正向传递，而不共享计算。SPPnet通过共享计算加速R-CNN。
SPPnet也有显著的缺点。像R-CNN一样，训练过程是一个多级流水线，涉及提取特征，使用log损失对网络进行微调，训练SVM分类器，最后拟合检测框回归。特征也写入磁盘。但与R-CNN不同，提出的微调算法不能更新在空间金字塔池之前的卷积层。这种限制（固定的卷积层）限制了深层网络的精度。