目标检测系列——Fast R-CNN原理详解

 

🍊作者简介:秃头小苏,致力于用最通俗的语言描述问题

🍊往期回顾:目标检测系列——开山之作RCNN原理详解

🍊近期目标:拥有10000粉丝
🍊支持小苏:点赞👍🏼、收藏⭐、留言📩


 

目标检测系列——Fast R-CNN原理详解

写在前面

  在上一篇,我们介绍过RCNN的原理,详情戳☞☞☞了解🌱🌱🌱这里再来简要概述一下RCNN的算法步骤:

  1. 候选区域生成
  2. 神经网络提取特征
  3. SVM分类器分类
  4. 回归器修正候选框位置

  继RCNN发布后,RGB大神又发表了Fast R-CNN🍍🍍🍍先来看看论文中表示Fast R-CNN结果的图片,如下:

image-20220620165139796

  关于这张经典的图片,现在大家只要又一个直观的感受即可,后面会深度解析。此篇文章较RCNN有了较大提示,Fast R-CNN其主要步骤如下:

  1. 候选区域生成
  2. 完整图像输入网络,候选框投影到特征图得到特征矩阵
  3. 特征矩阵经ROI pooling层缩放至统一大小,后将特征图展平得到预测结果

  可以看到,仅从RCNN和Fast R-CNN的步骤来看,它们还是存在一些差异的,下面将会具体谈谈这些步骤的具体细节,一起来看看吧🍀🍀🍀

 
 

候选区域生成

  候选区域生成和R-CNN没有区别,同样采用的是SS算法,这里就不重复介绍了,不清楚的可以参考上篇R-CCN博文🍂🍂🍂

 

 

完整图像输入网络,候选框投影到特征图得到特征矩阵

  还记得在R-CNN中我们输入网络的是什么嘛?这里就不卖关子了,在R-CNN中我们输人的是经SS算法得到的2000个候选框,这显然需要巨大的计算量;而在Fast R-CNN中,我们仅需要将原始图像输入到特征提取网络中得到原始图像的特征图即可。🌼🌼🌼这里你或许存在这样的问题:既然输入网络的是原始图像,那第一步在原始图像中生成的候选框该怎么利用呢?其实这一部分是借鉴了何凯明的SPP-Net——原始图像中的某个候选框经过神经网络后会映射到所得特征图的相应位置,这个位置是可计算的。为方便大家理解,我画了下图供大家参考:

image-20220621152723342

  关于上述的映射规则,大家可以参考这篇博文:SPP-net 🍉🍉🍉

 
 

特征矩阵经ROI pooling层缩放至统一大小,后将特征图展平得到预测结果

  在Fast R-CNN中,我们没有像R-CNN中一样对图片进行强制缩放,而是我们在得到特征图上的映射后(也即候选框),将这些候选框进行ROI pooling操作将不同大小的候选框统一缩放至统一的大小,ROI pooling的操作如下图所示:即不论原始特征图大小如何,我们都先将特征图分成7*7=49等份,然后每一份采用最大池化或平均池化,将原特征图下采样成7*7统一大小。image-20220621160714577

  特征图变成统一尺寸后,就可以将其展平送入全连接层了,之后再接上softmax层和regressor层即可输出。

 
 

Fast R-CNN完整流程

  通过上文的讲述,现在相信大家再看这个图会更加深刻。大致过程和上文所述一致,这里不在叙述🌵🌵🌵

image-20220621163932038

 
 

损失函数

  损失函数共有两部分组成,一部分是分类损失,一部分是边界框回归损失。

image-20220621171009785

image-20220621171020089

 
 

小结

  Fast R-CNN的原理部分就介绍到这里了,希望可以对大家有所帮助。🍀🍀🍀后续会更新Faster_RCNN的内容以及相关代码讲解,一起加油吧!!!

 
 

参考链接

RCNN理论合集🍁🍁🍁

深度学习_FasterRCNN论文详解🍁🍁🍁

 
 
如若文章对你有所帮助,那就🛴🛴🛴

咻咻咻咻~~duang~~点个赞呗

对人工智能感兴趣的可以扫码加入C站人工智能官方社群,欢迎各位小伙伴加入交流学习,一起进步!!

  • 26
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 23
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

秃头小苏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值