一、论文相关信息
文章发表在ICCV 2015的会议上
作者是Ross Girshick
文章链接可看Link
Fast R-CNN是对R-CNN的改进,在速度和检测精度上都有提升。
二、Fast R-CNN 解决了R-CNN和SPPnet 的问题
R-CNN存在三个问题
- R-CNN的训练是多阶段的流水线,速度慢。
- 训练的空间和时间花销大。
- 目标检测慢。
SPPnet的问题与R-CNN类似,不同在于R-CNN没有共享计算,而SPPnet有共享计算。但是SPPnet用微调的方法不能更新在空间金字塔池化前的卷积层。
因此Fast R-CNN的贡献是
- 有比R-CNN和SPPnet更高的检测性能。
- 训练是单阶段,使用多任务的loss。
- 训练能够更新所有的网络层。
- 不需要用磁盘存储特征。
三、Fast R-CNN的网络结构
Fast R-CNN首先用VGG网络提取图片的特征,然后对于每个对象在feature map上用RoI pooling层提取一个长度固定的向量。
每个特征向量都会被送到全连接层中。然后通过两个相似的分支,分别做识别和bbox回归。