RCNN算法流程

介绍:2014年提出,之前目标检测为手工提取特征,为深度学习提取目标特征的开山之作。

 

一、总体流程可分为四个步骤

 二、各个步骤

1.候选区域的生成

 2.对于每个候选区域,使用深度网络提取特征

 CNN其实就是图像分类网络,只不过是在图像分类中在CNN提取特征展平处理之后,要经过一个全连接层(输出通道数为类别个数)和softmax层,这里把这部分去掉了,从而每个框框留下了4096维的特征向量,总共为【2000,4096】。

3.特征送入每一类的分类器,判定类别

a、SVM是一个二分类器,这里以VOC数据集为例,有20个类别,所以需要20个SVM分类器【4096,20】,每个分类器会输出是该类别的得分。

  

b、对于SVM输出矩阵【2000,20】,对于每一列,代表这两千个候选框中属于该类别的分数,对于该列,通过非极大值抑制的方式剔除重叠建议框,如此循环,直到把该类别的2000个候选框遍历完。

 

 4.使用回归器精细修正候选框位置

 其实这里可以分为两步。第一步是上一步筛选出来的20个类别的建议框之后(从【2000,20】个建议框中筛选得到的),会对这些建议框进一步筛选,每个类别的建议框(【2000,1】筛选得到的)中会与标注该类别的真实grounf_truth计算IOU,筛选出大于阈值的候选框。

第二步是对于上一步【2000,20】个候选框中筛选出来的,找到该候选框对应当的第二步提取得到的4096维的向量(从【2000,4096】中筛选),用20个回归器分别对20个类别中剩余的建议框回归操作(分类器输出为【目标建议框中心X偏移量,Y偏移量,边界框高度缩放因子,宽度缩放因子】),通过得到的输出对于边界框进行调整。

三、总结

 

FasterRCNN

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值