首页:https://blog.csdn.net/u014236392/article/details/86767950
论文:Fast R-CNN
official code - caffe:https://github.com/rbgirshick/fast-rcnn
1.
检测要求的精确定位目标导致复杂性产生,其中两个主要挑战是:
(1)必须处理大量候选目标区域(proposals);
(2)这些候选框只提供了粗略定位,必须进行精修来精准定位。而解决这些问题的办法往往牺牲了速度、准确率或者简易性。
1.1 R-CNN and SPPnet
① 训练过程是多级流水线。R-CNN首先使用目标候选框对卷积神经网络使用log损失进行微调。然后,它将卷积神经网络得到的特征送入SVM。 这些SVM作为目标检测器,替代通过微调学习的softmax分类器。 在第三个训练阶段,学习检测框回归。
② 训练在时间和空间上是的开销很大。对于SVM和检测框回归训练,从每个图像中的每个目标候选框提取特征,并写入磁盘。
③ 目标检测速度很慢。在测试时,从每个测试图像中的每个目标候选框提取特征。
R-CNN很慢是因为它为每个目标候选框进行卷积神经网络正向传递,而不共享计算。SPPnet