目标检测算法(一):RCNN

论文题目:Rich feature hierarchies for accurate oject detection and semantic segmentation

实验结果:Pascal VOC 2012(20类) mAP:53.3%

整体框架:

                               

过程:

image --> selective search --> 2K proposals --> warped region(227x227) --> AlexNet(5 Conv + 2 Full) --> 4096-D --> SVM

微调:

提取ILSVRC 2012的模型和权重(1000类 识别能力)--> VOC做finetune(21类 还有background)(目的是提取图像特征 把已经训练好的网络权重作为初始化权重,修改最后一层分类维度,然后训练整体参数)

在proposals里面IoU>0.5 作为positive 否则作为negative(感觉是为了训练SVM)

在这里有个很重要的概念:非极大值抑制(NMS)

非极大抑制:

 

proposals--> 分类网络(在这里是线性SVM) --> 每个框每一类的置信度 --> 回归网络(例如DPM检测中的Linear regression model即对于每一个类,训练一个线性回归模型去判定这个框是否框得完美) -->修正位置 -->非极大抑制

非极大抑制具体做法:

就像上面的图片一样,定位一个车辆,最后算法就找出了一堆的方框,我们需要判别哪些矩形框是没用的。非极大值抑制的方法是:先假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大属于车辆的概率 分别为A、B、C、D、E、F。

(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;

(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。

(3)从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。

就这样一直重复,找到所有被保留下来的矩形框。  (参考:https://www.cnblogs.com/makefile/p/nms.html

在R-CNN中,非极大值抑制的阈值为0.3, 是在测试阶段中[0,0.1,0.2,0.3,0.4,0.5]实验得到的。

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值