【目标检测系列】三、R-CNN


参考资料

论文

  R-CNN

博客

  RCNN 系列详解


第1章 RCNN概述

 R-CNN是首个将 CNN 引入目标检测领域的算法模型,R-CNN 主要是在特征提取阶段使用CNN(AlexNet),其它阶段使用的还是传统目标检测的方法,R-CNN目标检测主要分为四个大的阶段:

  • (1)产生候选区域:对于输入的图片,使用Selective Search方法(了解即可),选择出2000个候选区域(每个区域大小不一);
  • (2)特征提取:使用AlexNet对每一个候选区域提取特征,得到 2000 × 4096 2000\times 4096 2000×4096 维的特征向量;

注1:在进行特征提取之前,需要先对上一步生成的候选区域进行调整,使其变为227*227,这是因为AlexNet输入是固定的,当然,其实卷积操作的输入可以不固定,全连接层的输入大小才是固定的,这也是后面几个模型会改进的。

注2:调整的方法比较暴力,不管输入是多大

  • (3)候选区域类别判断:将 2000 × 4096 2000\times4096 2000×4096 维特征向量送入到21个 (20个类别+1个背景) SVM分类器中,每一个SVM分类器包含4096个参数,所以可以看成两个矩阵相乘,即 W 1 ( 2000 × 4096 ) × W 2 ( 4096 × 21 ) = W 3 ( 2000 × 21 ) W_1(2000×4096)×W_2(4096×21)=W_3(2000×21) W1(2000×4096)×W2(4096×21)=W3(2000×21) ,这样就得到了每一个候选区域是某个类别的概率值。因为一张图片出现有上千个物品的可能性微乎其微,所以必定有大量的候选区域是重叠的,因此需要去除冗余的候选框。作者在此处使用非极大值抑制(NMS)方法来去除冗余候选框,对于每一个类别中IoU大于给定阈值的候选区域。这样就得到了每一个类别得分最高的一些候选区域

  • (4)使用回归器对候选框位置调整:对于上一步经过 NMS 筛选后的候选区域,其精度必定不够,所以需要进行进一步的调整。

在这里插入图片描述


第2章 RCNN总结

 在文章中,作者认为 R-CNN 较之前的算法,能够取得30%的改进是基于以下两点:

  1. 使用了CNN来提取候选区域的特征。
  2. 使用迁移学习,因为目标检测领域的数据相比图像分类任务要少很多,所以使用在图像分类上训练好的模型,经过 fine-tune 可以很好的运用在目标检测上。

在这里插入图片描述

R-CNN的不足

  • 速度慢,因为需要对selective search算法生成2K个候选区域,并对2k个候选区域分别提取特征,而又由于候选区域的重叠问题,所以这中间有着大量的重复计算(这也是后面的改进方向)。
  • 训练步骤繁琐,需要先预训练CNN,然后微调CNN,再训练20个SVM,20个回归器,期间还要涉及用NMS去除候选冗余框

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

travellerss

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值