目标检测(四):Fast-RCNN
Fast-RCNN1是在RCNN和SPPnet的基础上进行改进得到的,SPPnet的论文我并未研读,这是看了几篇博客的介绍,但是其中的SPP(Spatial Pyramid Pooling)思想还是很重要的,如果后期有机会的话再补上。Fast-RCNN主要工作在于设计了一个ROI-pooling层;并舍弃SVM,直接利用softmax层进行类别预测。相比于RCNN和SPP,Fast-RCNN的优点如下:
- 检测效果更好、速度更快。
- 训练过程是single-stage的,使用的是multi-task损失函数。(RCNN的训练是multi-stage的,分别需要对特征提取器、SVM分类器、BB回归器进行训练;而fast-rcnn只用一个包含多任务的损失函数来进行single-stage训练)
- 训练可对所有layer进行更新。这也是受上面一条影响,RCNN的multi-stage训练决定了某些层的梯度无法更新。