从R-CNN到Faster-R-CNN——两阶段目标检测的演进过程

最新推荐文章于 2024-05-25 16:26:19 发布

Paul-LangJun

最新推荐文章于 2024-05-25 16:26:19 发布

阅读量1.3k

点赞数

分类专栏：机器学习神经网络文章标签：计算机视觉深度学习卷积机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/107646049

版权

神经网络同时被 2 个专栏收录

45 篇文章 9 订阅

订阅专栏

35 篇文章 3 订阅

订阅专栏

关于目标检测，目前可以分为一阶段和两阶段方法，一阶段方法主要是SSD和YOLO系列，两阶段方法包括R-CNN、SPP-net，Fast R-CNN、Faster R-CNN等。本文将重点对两阶段方法的演变过程做一些简单的总结，对于这些方法的实现细节介绍不在本文范围之内，感兴趣的同学可以参考末尾的参考文献部分。

一、R-CNN

该方法应该是突破传统目标检测方法比较重要的开篇之作之一。个人认为其突破性在于：

引入了候选区域概念，没有采用滑动窗口技术（候选区域的概念在早前可能已经存在）；
引入CNN对候选区域进行特征提取；
采用了大量标注数据上的监督预训练模型 + 领域数据微调预训练模型的范式；

关于第3点，在后来改进的模型中，几乎都能看到该范式的影子。

该模型的性能较传统模型有了很大改进，具体可参见论文。缺点也很明显，为了提取每个候选区域的特征，在输入图像上重复进行了多次卷积计算，在性能上大打折扣，检测每张图像的耗时平均1~2秒左右。

二、SPP-net

该方法改善了R-CNN模型中不能共享卷积计算的问题，同时引入了一些新的特性（SPP池化）。关于该模型的介绍，可参考本人另外一篇博文 https://blog.csdn.net/gaoxueyi551/article/details/107444061。

三、Fast R-CNN

该模型可以说是对R-CNN和SPP-net的改进，改进之处在于：

单一训练阶段，而非上述方法的多各训练阶段（CNN特征提取阶段、分类阶段、回归阶段）；
特征提取阶段没有磁盘存储需求；
提出了Region Of Interrst（ROI）层的概念，本质是单一层次的SPP池化层；
将分类损失和回归损失集中于单一损失函数，即multi-task损失，并加入L1正则，对噪音更具鲁棒性；
对全连接层，采用SVD进行了压缩，参数有效减少；

在实验部分，作者发现使用单一尺度的数据进行训练和测试就可以满足基本的需求，多尺度反而收效甚微。

四、Faster R-CNN

现有的方法在生成候选区域时均采用了一些耗时比较高的算法，如Selective Search、EdgeBox等，在候选区域生成上，该方法可以说是对之前所有方法的一个颠覆。其改进之处在于：

采用RPN网络自动提取候选区域，摈弃了现有的候选区域生成算法，速度快的主要原因；
实现了RPN网络与Fast-R-CNN共享卷积特征计算；
训练和测试基于单一尺度；

RPN层的实现本质是滑动窗口，但在每个不同的滑动窗口位置上又附带了多个不同尺寸和宽高比的anchor，以便于检测不同形态的物体，如人（比较高），自行车（比较长），卡车（又长又大），原始论文采用了9个anchor。由于这个方法，Faster-R-CNN模型可以在单一尺度的图像上进行训练和测试。

五、参考文献

[1]. Selective Search for Object Recognition

[2]. Edge Boxes: Locating Object Proposals from Edges

[3]. Fast R-CNN

[4]. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

[5]. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

[6]. 《Rich feature hierarchies for Accurate Object Detection and Segmentation》（未找到paper链接）

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
从R-CNN到Faster-R-CNN——两阶段目标检测的演进过程

关于
复制链接

扫一扫

专栏目录

Paul-LangJun CSDN认证博客专家 CSDN认证企业博客

码龄12年

161: 原创

3万+: 周排名

1万+: 总排名

42万+: 访问

: 等级

4631: 积分

148: 粉丝

332: 获赞

86: 评论

1166: 收藏

私信

关注

热门文章

分类专栏

c
java 31篇
c++ 14篇
数据结构与算法 45篇
重构 2篇
数据库 5篇
android 8篇
设计模式 6篇
面向对象 14篇
多线程 16篇
think in life
Linux 11篇
机器学习 35篇
概率与统计 21篇
神经网络 45篇
Python 18篇
大数据 3篇
分布式 6篇
爬虫 1篇
正则表达式 1篇
线性代数 7篇
最优化方法 4篇
前端技术

最新评论

矩阵乘法的优化
m0_65000939: 分块那个不太对，如果说不是恰好分成块，有剩余的话，后面那部分算剩余的没算完全。
深度学习中的He初始化
Paul-LangJun: y = wx, 相当于多个均值为0的对称分布的加权，其最终的变量y的分布也是均值为0的对称分布，可以搜下概率轮方面的材料
深度学习中的He初始化
一个学数学的程序媛: yl−1 以0为中心形成对称分布，请教下这是为什么呢。
没有思考过 Embedding，不足以谈 AI（转）
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
矩阵乘法的优化
Jack1号: 约等于 int i=0

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。