目标检测算法（一）：RCNN

最新推荐文章于 2022-03-02 20:48:01 发布

繁星物语

最新推荐文章于 2022-03-02 20:48:01 发布

阅读量143

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/craftsman111/article/details/89813044

版权

论文题目：Rich feature hierarchies for accurate oject detection and semantic segmentation

实验结果：Pascal VOC 2012(20类) mAP：53.3%

整体框架：

过程：

image --> selective search --> 2K proposals --> warped region(227x227) --> AlexNet(5 Conv + 2 Full) --> 4096-D --> SVM

微调：

提取ILSVRC 2012的模型和权重（1000类识别能力）--> VOC做finetune（21类还有background）（目的是提取图像特征把已经训练好的网络权重作为初始化权重，修改最后一层分类维度，然后训练整体参数）

在proposals里面IoU>0.5 作为positive 否则作为negative(感觉是为了训练SVM)

在这里有个很重要的概念：非极大值抑制（NMS）

非极大抑制：

proposals--> 分类网络（在这里是线性SVM） --> 每个框每一类的置信度 --> 回归网络（例如DPM检测中的Linear regression model即对于每一个类，训练一个线性回归模型去判定这个框是否框得完美） -->修正位置 -->非极大抑制

非极大抑制具体做法：

就像上面的图片一样，定位一个车辆，最后算法就找出了一堆的方框，我们需要判别哪些矩形框是没用的。非极大值抑制的方法是：先假设有6个矩形框，根据分类器的类别分类概率做排序，假设从小到大属于车辆的概率分别为A、B、C、D、E、F。

(1)从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;

(2)假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我们保留下来的。

(3)从剩下的矩形框A、C、E中，选择概率最大的E，然后判断E与A、C的重叠度，重叠度大于一定的阈值，那么就扔掉；并标记E是我们保留下来的第二个矩形框。

就这样一直重复，找到所有被保留下来的矩形框。（参考：https://www.cnblogs.com/makefile/p/nms.html）

在R-CNN中，非极大值抑制的阈值为0.3，是在测试阶段中[0,0.1,0.2,0.3,0.4,0.5]实验得到的。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
目标检测算法（一）：RCNN

论文题目：Rich feature hierarchies for accurate oject detection and semantic segmentation实验结果：Pascal VOC 2012(20类) mAP：53.3%整体框架：过程：image --> selective search --...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。