RCNN(丰富的特征层次结构用于精确的目标检测和语义分割)的学习过程

最新推荐文章于 2023-04-10 09:41:21 发布

绿小油

最新推荐文章于 2023-04-10 09:41:21 发布

阅读量535

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/html5baby/article/details/90447369

版权

参考博客：

https://www.cnblogs.com/gongxijun/p/7071509.html

https://blog.csdn.net/shenxiaolu1984/article/details/51066975

划重点：提出使用候选区域进行卷积提高了检测速度，使用特定任务进行fine-tuning提高了mAP。

RCNN的整体框架：

图1:目标检测系统概述。1.系统获取一个输入图像，2.提取2000个左右自底向上的区域建议，3.使用一个大型卷积神经网络(CNN)计算每个建议的特征，然后4.使用特定于类的线性SVM对每个区域进行分类。R-CNN在PASCAL VOC 2010上的平均精度(mAP)达到53.7%

1、候选区域的提取（SS方法）

SS(selective search)区域合并算法过程：对图像分成很多很多很多的小块，再使用一定的相似度计算方法进行合并……相似度的计算使用4个方向：颜色、纹理、合并后面积、合并后的bounding box面积。其中合并后面积越小越偏向于合并，可以防止大面积吞掉小面积；合并后的bounding box越小越偏向合并，可以防止并没有和大相关度的两个区域（有断崖）合到一块。

2、特征提取

（1）warp：将所有的候选区域调整到规定的统一大小227*227，有三种方法。随机采样把原图像周围16个像素的信息利用起来。（具体方法在论文的附录A中）

（2）使用预训练好的CNN网络对warp后的候选特征区域进行特征提取，用训练好的SVM对整个特征向量的每个类别单独打分，用NMS淘汰掉IOU大于阈值0.5的候选框。

（3）CNN网络：先使用ILSVRC2012分类数据集（此时没有边框的定位信息）进行预训练得到的是一个1000个类的分类器模型，再用VOC进行fine-tuning，将网络变成只识别21各类别的（20个类别+1个背景）。在进行fine-tuning时，对预训练的CNN进行SGD训练，当iou>=0.5,Positive，否则为Negetive。每轮SGD都是128，包含32个正例96个负例。

3、分类器

使用SVM。CNN网络的全连接层f7的特征提取出来之后，对每一类训练一个SVM，此时阈值设置为0.3（之所以小于fine-tuning的0.5是因为在fine-tuning时样本少阈值高会导致过拟合）。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄10年

23
原创

39
点赞

41
收藏

8
粉丝

关注

私信

最新评论

WPS公式编辑器
郑辉辉: 非常好的UI设计，是我的大脑停止旋转
2019/6/4CS231n课程笔记（反向传播和神经网络）
太气了准备莱万汀: 关于max的雅克比矩阵（行为y，列为被求导的x）为什么一定是对角阵，我的理解是对于任何一个x，max(0, x)的输出只会与这个x有关，也就是说任意一行/一列最多只会有x这一个元素与梯度计算有关；max(0, x)的梯度可能为0，也可能为x，因此我们也可以知道对角线上的梯度值可能为1（x>=0）或者为0(x<0）
M2Det的学习过程
Thecoastlines: 大佬牛批
pytorch环境numba安装包安装失败，llvmlite安装失败！
luma8442: 真是绝了太感谢了楼主了
2019/8/14Faster RCNN自学记录
石湖一叶: 请问博主有把faster rcnn的代码跑通一遍吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。