Fast R-CNN是在R-CNN和SPP-Net的基础上改良而来的。
R-CNN的缺点
a,步骤繁琐
首先需要对输入的数据进行wrap或者crop,从而将数据变为fix的输入(224*224)
然后对于输入的每一个proposal,通过5个卷积网络和2个全连接网络进行训练
而且还需要使用SVM对数据进行fine tuning
最后还需要对bbox进行回归学习
b,占用空间和时间
在SVM和bbox回归时,从图片中获取的特征都需要保存到硬盘
c,监测目标时的速度较慢
SPP-Net的优缺点
a,从输入图片中计算feature maps,从而避免RCNN式的对proposal数据进行重复计算
b,特征每次从该图片的feature maps中提取,但是提取的数据还是要保存到硬盘,因此也比较占空间
c,步骤也比较繁琐
首先需要提取feature maps
然后从feature maps中提取特征vector
而且还需要使用SVM对数据进行fine tuning,
训练时,只能够调节全连接层的参数,对于卷积层,不做操作,因此牺牲了算法的准确性。
最后还需要对bbox进行回归学习
Fast R-CNN,解决了以上两种算法,步骤繁琐,占用空间的问题,提升主要有以下4个方面
a,更好的检测质量
b,训练数据时,但多任务损失,单阶段,
c,训练时,可以调节所有层级的参数
d,不需要将特征保存在硬盘