Faster R-CNN系列理论整理(附视频讲解)

前言

经过R-CNN和Fast R-CNN的积淀,Ross B. Girshick在2016年提出了Faster R-CNN,在结构上,Faster R-CNN已经将feature extraction,proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。


R-CNN(Region with CNN feature)

如图所示:R-CNN分为四步
R-CNN

第一步:
在这里插入图片描述
第二步:在这里插入图片描述

第三步:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

第四步:
在这里插入图片描述

R-CNN框架:
  1. Region proposal(Selective Search)
  2. Region proposal resize 成227*227送入Feature extraction(CNN)
  3. Classification(SVM)
  4. Bounding-box regression(regression)
R-CNN存在的问题:
  1. 测试速度慢:测试一张图片约53s(CPU)。用Selective Search算法提取候选框用时约2s,一张图像内候选框之间存在大量重叠,提取特征冗余。

  2. 训练速度慢:需要训练三个网络(CNN分类网络、SVM分类器和regression网络),而且这三个网络是相互独立的。过程及其繁琐。

  3. 训练所需空间大:对于SVM和bbox回归训练,需要从每个图像中的每个目标候选框提取特征,并写入磁盘,对非常深的网络,如VGG16,从VOC07训练集上的5k图像上提取的特征需要存储数百GB的存储空间。


Fast R-CNN

Fast R-CNN框架
  1. 一张图像生成2k个候选区域Region proposal(Selective Search)

  2. 图像输入到网络得到特征图(其中特征图随机采样成数量均衡的正负样本,即前景物体为正(IOU>0.5),背景为负样本(IOU<0.5)),将SS算法生成的候选框投影到特征图上获得相应的特征矩阵(这样就减少了特征的提取工作,2k个region proposal只需要映射框即可,中间的特征不需要重复提取)。

  3. 将每个特征矩阵通过ROI pooling层统一缩放到7*7大小的特征图(即不限制图像输入大小),接着将特征图展平通过2个FC层并联得到预测结果。(只用一个网络取代了R-CNN的SVM分类器和regresion回归器)

如图所示为Fast R-CNN示意图:
在这里插入图片描述

Faster R-CNN

Faster R-CNN的框架
  1. 将图像输入到网络得到相应的特征图
  2. 使用RPN结构生成候选框,将候选框投影到特征图上获得相应的特征矩阵
  3. 将每个特征矩阵通过ROI pooling层统一缩放到7*7大小的特征图,接着将特征图展平通过2个FC层得到预测结果。

如图所示为Faster R-CNN示意图:
在这里插入图片描述

与Fast R-CNN不同的是SS算法替换成了RPN,搞懂了RPN,Faster R-CNN也就懂了

在这里插入图片描述

如图所示为计算k个anchor boxes:采用滑动窗口
在这里插入图片描述

计算不同尺度的anchor:
在这里插入图片描述

在这里插入图片描述
以上即为RPN(region proposal network)

到此结束

如想深入了解可看相关视频Faster RCNN理论合集

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值