论文笔记之Faster R-CNN

1.回顾

1.1 RCNN

算法流程:

  • 使用Selective Search方法在输入的每一张图片上生成2000个左右的候选区域;
  • 对每个候选区域,使用深度卷积网络提取特征;
  • 特征送入每一类的SVM分类器,判别是否属于该类;
  • 使用回归器进一步修正候选框位置。
    在这里插入图片描述

1.2 Fast RCNN

1.2.1 改进之处:

  • 卷积不再是对每个候选区域做,而是对整张图片,减少了重复计算。
  • 使用ROI pooling进行特征的尺寸变换,将候选区域变换为一样大小,这样才可以输入全连接层。
  • 将分类器放进网络里面一起进行训练,用softmax代替SVM。

1.2.2.算法流程

  • 深度卷积网络提取图像特征;
  • 使用Selective Search方法在输入的每一张图片上生成2000个左右的候选区域;
  • 将以上两部分送入ROI Pooling层,使候选区域大小一样,然后传入全卷积层;
  • 分为两个输出层,其中一个使用softmax进行分类,另一个输出四个值(边框回归)。

在这里插入图片描述

2. Faster R-CNN

2.1 改进之处

(1)使用RPN网络生成候选区域
(2)将候选区域生成,特征提取,分类器分类,回归器回归这四步全都交给深度神经网络来做,大大提高了操作的效率。

2.2 总体结构

在这里插入图片描述

  • 首先,输入图片统一缩放到固定大小;
  • 接着深度卷积网络提取图像特征;
  • 接着图像特征传入RPN网络;
  • 接着是ROI Pooling层,传入的是图片特征和proposal,输出的是proposal feature maps;
  • 最后是全连接层进行分类和再一次回归。

2.3 anchors

对于卷积特征图,每个点生成k(9)个不同大小的anchor作为初始的检测框,宽高比分别为1:1、1:2、2:1三种,其实就是多尺度操作。

2.4 RPN 网络

1)首先经过3×3卷积(输入的M×N大小经过一系列卷积(不考虑池化层)操作后变为(M+2)×(N+2)(卷积的填充P=1),再经过3×3卷积就可以变为M×N大小。总体来说(池化层考虑进来)最终的特征图大小为(M/16)×(N/16)(4个池化层,每个池化缩小两倍));
2)两条线路,上面的通过softmax生成正例和负例的分类;下面的计算对应的边界框回归偏移量;
3)最后的proposal层综合正例以及偏移量获取精确的proposal,同时剔除太小和超出边界的proposals。

2.5 损失函数

在这里插入图片描述
其中,i是mini-batch中的anchor的索引,pi是第i个anchor作为object的预测概率。如果anchor为正,则ground-truth标签在这里插入图片描述为1,如果anchor为负,则ground-truth标签在这里插入图片描述为0。 ti是代表预测边界框的4个参数化坐标的向量,ti是与正anchor关联的ground-truth的4个参数化坐标。分类损失Lcls是两个类别(object与非object)之间的对数损失。对于回归损失,使用Lreg(ti; t i)= R(ti􀀀t i),其中R是smooth L1损失函数。p i Lreg表示仅对正anchor(p i = 1)激活回归损失,否则不计算回归损失(p i = 0)。cls和reg层的输出分别由fpigftig组成。
这两项通过Ncls和Nreg归一化,并通过平衡参数λ加权。在当前的实现中,等式(1)中的Ncls项数值等于mini-batch大小,而Nreg项的数值等于anchor的数量。默认情况下,设置λ= 10。

2.6 训练

在这里插入图片描述
第一步,训练RPN。该网络使用ImageNet预训练的模型初始化,并针对region proposal任务端到端进行了微调。在第二步中,使用步骤1 RPN生成的proposal,通过Fast R-CNN训练一个单独的检测网络。该检测网络也由ImageNet预训练模型初始化。此时,两个网络不共享卷积层。在第三步中,使用检测网络初始化RPN训练,但是调整了共享卷积层,并且仅微调了RPN唯一的层。现在,这两个网络共享卷积层。最后,保持共享卷积层固定不变,对Fast R-CNN的唯一层进行微调。这样,两个网络共享相同的卷积层并形成统一的网络。可以进行类似的交替训练进行更多迭代,但是观察到这样做的提升很小。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值