RCNN个人的几点见解

         已经有将近一年的时间没有写博客了,说来真是惭愧。最近想学习一点目标检测的东西,今天看了RCNN,请教了同事一些不懂得地方,在这里做一个简短的总结。其实,网上种总结已经非常多了,我这里只想写点我个人的理解。方便以后回归使用。废话少说,直接进入正题。

1、选择候选区域的算法,论文中使用的是“selective search”,我记得很久之前看这篇论文时,我还在网上找到过这个算法的源码,跑了一下,效果还不错。有兴趣的朋友可以github上找找。另外论文中叶提到,使用其他算法也可以,目的是找到候选框代替滑动窗口。

2、greedy non-maxinum suppression(非极大值抑制),通俗的说就是只要最大值,不是最大值的抛弃。

3、IoU(intersection-over-union,交并比),通俗的讲就是两个候选框的交集和并集的比值。下图中红色区域为两个候选框的交集部分。

4、整体的流程(通用目标检测,一张图片里可能有不同的物体)。

(1)利用某个候选框算法产生候选框,一般数量会非常多,>2000个。

(2)对每一个候选框里的图片进行缩放,利用CNN对每个候选框进行特征提取。

(3)利用SVM对提取的特征进行打分,论文中是使用的多个二分类SVM,我们会得到一个候选框属于某一类的概率值,概率值最大的类,就是该候选框属于的类,一般对分数从大到小进行排序,取前K(K=2000)个候选框。

(4)由于一张图片里可能有多个目标,比如图片里同时有两个人,一只狗和一只猫。由于我们第三步使用SVM进行分类,所以我们可以知道每个候选框属于的类别,假设属于人得候选框有100个。

(5)分析人的候选框。首先这100个候选框是按分数从小到大学习的。下图列出其中最大的四个


我们首先选择框A因为它的分数最高,然后我们选择框B:

【1】首先,判断A和B是否有交集,如果没有交集,则A和B虽同属于人,但属于不同的人;

【2】如果A和B有交集:

【2.1】计算A和B的交并比,如果交并比的值大于阈值则认为A和B同属于一个人的框,根据非极大值抑制原则, 抛弃B框,认为A框最能代表这个人;

【2.2】如果A和B的交并比,小于阈值,则A和B虽同属于人,但属于不同的人

【3】如果经过以上两步后B被抛弃,则C框的分析与B框相同;如果B框被保留,则C框分别于A框和B框进行步骤1,2的分析。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值