目标检测之Fast R-CNN

一、目标检测之Fast R-CNN

Fast R-CNN
论文链接:http://arxiv.org/abs/1504.08083
论文翻译:https://blog.csdn.net/xiaqunfeng123/article/details/78716060
论文详解:https://blog.csdn.net/wopawn/article/details/52463853

二、Fast R-CNN算法

1、优势:(1)检测精度更高(比R-CNN/SPPnet);(2)训练统一,训练是使用多任务损失的单阶段训练;(3)训练可以更新所有网络层参数;(4)不需要磁盘空间缓存特征。
2、算法结构
在这里插入图片描述
步骤:

  1. 任意size图片输入CNN网络,经过若干卷积层与池化层,得到特征图;
  2. 在任意size图片上采用selective search算法提取约2k个建议框(与R-CNN类似);
  3. 根据原图中建议框到特征图映射关系,在特征图中找到每个建议框对应的特征框【深度和特征图一致】,并在RoI池化层中将每个特征框池化到H×W【VGG-16网络是7×7】的size;
  4. 固定H×W【VGG-16网络是7×7】大小的特征框经过全连接层得到固定大小的特征向量;
  5. 第4步所得特征向量经由各自的全连接层【SVD分解实现,用SVD奇异值分解算法加速全连接层计算】,分别得到两个输出向量:一个是softmax的分类得分:K个目标类别+1个背景类别;一个是Bounding-box窗口回归:K个目标类别的精细边框位置,每个位置有四个数值(r,c,h,w),(r,c)为左上角坐标,(h,w)为边框的高和宽;
  6. 利用窗口得分分别对每一类物体进行非极大值抑制剔除重叠建议框,最终得到每个类别中回归修正后的得分最高的窗口。

三、Fast R-CNN不足

纵使Fast RCNN与RCNN相比提升了不少,但是Fast RCNN仍旧有许多不足之处:因为Fast RCNN使用的是selective search选择性搜索,这一过程十分耗费时间,其进行候选区域提取所花费的时间约为2~3秒,而提取特征分类仅需要0.32秒,这会造成无法满足实时应用需求,而且因为使用selective search来预先提取候选区域,Fast RCNN并没有实现真正意义上的端到端训练模式,因此在众人的努力下,Faster RCNN应运而生。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值