Fast R-CNN学习笔记
文章来源:Girshick R. Fast r-cnn[C]//Proceedings of the IEEE InternationalConference on Computer Vision. 2015: 1440-1448.
1.算法提出的背景
目前deep ConvNets显著提高了图像分类和目标识别的精度,和图像分类相比,目标检测需要更多复杂的方法去解决,是更有挑战性的问题。由于检测需要目标精确的位置,这就带来了两个重要的困难:首先,大量的候选目标区域(被称为“proposals”)要处理;其次,这些候选只是简单地提供了大致的位置,还需要进一步精确。解决这些问题的方法常常会导致速度、精度和简易性的下降。
Fast R-CNN在训练一个深检测网络(VGG16)上,比R-CNN快9倍,比SPPnet快3倍。
R-CNN的缺点:
(1)训练是多阶段进行的。R-CNN首先使用log损失在目标提议方面对ConvNet进行了微调;然后调整SVMs适合于ConvNet特性,这些SVMs作为目标检测器,替换了通过惩罚协调学习的softmax分类器;第三个训练阶段,学得一个bounding-box回归。
(2)训练在时间和空间上花费较大。对于SVM和bounding-box回归训练,要从每张图片的每个中object proposal中提取特征,这既费时又费力。
(3)目标检测很慢。在测试时间,要从每张测试图片的每个object proposal中提取特征,很耗时。
R-CNN很慢的原因在于它对于每个object proposal都进行了