RCNN个人的几点见解

最新推荐文章于 2023-04-14 15:11:48 发布

Sunshine_in_Moon

最新推荐文章于 2023-04-14 15:11:48 发布

阅读量523

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Sunshine_in_Moon/article/details/78564732

版权

深度学习专栏收录该内容

20 篇文章 0 订阅

订阅专栏

已经有将近一年的时间没有写博客了，说来真是惭愧。最近想学习一点目标检测的东西，今天看了RCNN，请教了同事一些不懂得地方，在这里做一个简短的总结。其实，网上种总结已经非常多了，我这里只想写点我个人的理解。方便以后回归使用。废话少说，直接进入正题。

1、选择候选区域的算法，论文中使用的是“selective search”，我记得很久之前看这篇论文时，我还在网上找到过这个算法的源码，跑了一下，效果还不错。有兴趣的朋友可以github上找找。另外论文中叶提到，使用其他算法也可以，目的是找到候选框代替滑动窗口。

2、greedy non-maxinum suppression(非极大值抑制)，通俗的说就是只要最大值，不是最大值的抛弃。

3、IoU（intersection-over-union，交并比），通俗的讲就是两个候选框的交集和并集的比值。下图中红色区域为两个候选框的交集部分。

4、整体的流程（通用目标检测，一张图片里可能有不同的物体）。

（1）利用某个候选框算法产生候选框，一般数量会非常多，>2000个。

（2）对每一个候选框里的图片进行缩放，利用CNN对每个候选框进行特征提取。

（3）利用SVM对提取的特征进行打分，论文中是使用的多个二分类SVM，我们会得到一个候选框属于某一类的概率值，概率值最大的类，就是该候选框属于的类，一般对分数从大到小进行排序，取前K（K=2000）个候选框。

（4）由于一张图片里可能有多个目标，比如图片里同时有两个人，一只狗和一只猫。由于我们第三步使用SVM进行分类，所以我们可以知道每个候选框属于的类别，假设属于人得候选框有100个。

（5）分析人的候选框。首先这100个候选框是按分数从小到大学习的。下图列出其中最大的四个

我们首先选择框A因为它的分数最高，然后我们选择框B：

【1】首先，判断A和B是否有交集，如果没有交集，则A和B虽同属于人，但属于不同的人；

【2】如果A和B有交集：

【2.1】计算A和B的交并比，如果交并比的值大于阈值则认为A和B同属于一个人的框，根据非极大值抑制原则，抛弃B框，认为A框最能代表这个人；

【2.2】如果A和B的交并比，小于阈值，则A和B虽同属于人，但属于不同的人

【3】如果经过以上两步后B被抛弃，则C框的分析与B框相同；如果B框被保留，则C框分别于A框和B框进行步骤1,2的分析。

Sunshine_in_Moon

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RCNN个人的几点见解

已经有将近一年的时间没有写博客了，说来真是惭愧。最近想学习一点目标检测的东西，今天看了RCNN，请教了同事一些不懂得地方，在这里做一个简短的总结。其实，网上种总结已经非常多了，我这里只想写点我个人的理解。方便以后回归使用。废话少说，直接进入正题。1、选择候选区域的算法，论文中使用的是“selective search”，我记得很久之前看这篇论文时，我还在网上找到过这个算法的源码，跑了一下，效果
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。