SPP-net

最新推荐文章于 2024-10-07 06:31:57 发布

圆圆栗子君

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量852

点赞数 28

分类专栏：目标检测文章标签：目标跟踪人工智能计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51700479/article/details/135658898

版权

目标检测专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1 概述

1.1 基本介绍

2015年IEEE论文《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》,是对R-CNN的一种优化，SPP即Spatial Pyramid Pooling(空间金字塔池)，是一种基于图像金字塔结构的目标检测网络结构。其网络主要修正的是R-CNN网络的效率问题，也就是主要更改的是 R- CNN中每个ROI区域均需要通过一个CNN提取高阶特征的这个阶段 的结构

1.2 与RCNN的比较

R-CNN的作用比较强，其主要缺陷(结合SPP Net)就是效率问题：

计算量大，速度慢 ：每张图像的每个Propasal均需要通过CNN提取高阶特征、SVM进行分类等操作。

图像失真 ：每个Propasal区域在输入CNN网络之前，需要进行warp拉伸 /crop压缩操作，可能会影响图像质量以及模型效果。

SPP Net优化改进：

直接送入整个图像，所有区域 共享卷积计算(一遍) ， 在Conv5层提取所有区域的高阶特征

引入空间金字塔池( S patial P yramid P ooling) ，为不同尺寸的区域，在Conv5层上提取不同的特征，然后映射到尺寸固定的全连接上。

相比R-CNN需要对每个proposal做卷积，SPP Net只做一次卷积，将相应的sub-image映射到full-image卷积后的feature map上从而得到sub-image通过卷积层得到的feature。

2 SPP-net的原理

1.1 SPP-net的感受野了解

卷积神经网络CNN中，某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受

野receptive field。感受野的大小是由 kernel size，stride，padding , outputsize 一起决定的。

上述公式由下面卷积操作产生的feature map 公式反推可得的

感受野坐标映射如下图

1.2 SPP-net原理介绍

在上图RCNN中，因为要使提取区域的尺寸固定，使用resize会导致图像失真

在SPP-net中，则不会固定尺寸，选择性搜索（Selective Search）算法首先在原始图像上运行，以生成大约 2000 个区域提案，整张图像经过卷积后，这些提案在原始图像中对应的区域在经过卷积层处理后，在特征图上也有相应的映射。然后经过SPP层处理

空间金字塔池化层（SPP层）的目的是从每个区域提案中提取一个固定长度的特征向量，无论提案的尺寸如何。它通过在多个尺度（或称为级别）上进行池化操作来实现这一点。这些尺度对应于不同的区域划分，例如：

1x1：这是最简单的池化，将整个提案区域池化成一个单一的特征（最大值或平均值）。
2x2：将提案区域划分为四个相等的子区域，每个子区域独立进行池化操作。
4x4：类似地，将提案区域划分为十六个小子区域，并分别池化。

这样做的结果是，每个划分级别产生了固定数量的特征（1x1产生1个，2x2产生4个，4x4产生16个）。然后，这些特征被合并或拼接成一个固定长度的特征向量。例如，如果只使用上述三个划分级别，最终的特征向量将包含 1 + 4 + 16 = 21 个特征。

因此，SPP层允许网络适应不同尺寸的输入区域提案，而不需要事先将它们调整到某个固定的尺寸。这在处理实际图像中大小不一的对象时特别有用，因为它允许模型捕捉到不同尺度的上下文信息。如下图

3 SPP-net优缺点

SPP Net相比于R-CNN，有以下几个优点：

1 使用full-image卷积仅需要对原图像经过一次卷积操作就提取完所有区域的高阶特征属性；

2 使用SPP结构支持候选框大小可大可小，解决了R-CNN中候选框crop/warp所带来的图像失真的问题。

SPP Net的缺点和R-CNN还是类似的：

1 继续沿用R-CNN结构，特征提取、SVM分类器、BB回归器单独训练；

2 SPP Net没法fine tune训练前面的Conv部分的特征提取网络(效率低)。

圆圆栗子君

关注

28
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

圆圆栗子君 CSDN认证博客专家 CSDN认证企业博客

码龄4年

27: 原创

111万+: 周排名

22万+: 总排名

2万+: 访问

: 等级

701: 积分

334: 粉丝

423: 获赞

22: 评论

469: 收藏

私信

关注

热门文章

分类专栏

最新评论

强化学习基础（一）
CSDN-Ada助手: 恭喜你写了第20篇博客，标题为“强化学习基础（一）”！你的坚持和努力让我非常钦佩，同时也让我从你的博客中学到了很多知识。希望你能继续保持创作的热情和动力，同时也希望你可以在下一篇博客中深入探讨强化学习的进阶知识，让我们一起学习进步。期待你更多的精彩内容，加油！
CNN卷积理解
m0_68949064: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文。
输入数据预处理（去均值，标准化，归一化）
CSDN-Ada助手: 恭喜您写了第14篇博客！标题“输入数据预处理（去均值，标准化，归一化）”非常吸引人，内容也十分实用。您对数据预处理的讲解非常清晰，让我受益匪浅。在下一篇博客中，或许您可以探讨一下不同预处理方法在各种数据集上的效果对比，以及如何根据具体情况选择最适合的预处理技术。此外，如果能分享一些实际应用中的案例，将更加丰富和实践化您的博客内容。再次感谢您的分享，期待您未来更多精彩的创作！
CNN卷积理解
CSDN-Ada助手: 非常恭喜您完成了第15篇博客！标题“CNN卷积理解”非常吸引人，我可以感受到您对于这个主题的深入研究和理解。您对于卷积神经网络的解释和应用的阐述让我受益匪浅。在阅读您的博客后，我想提供一些建议，希望对您的下一步创作有所帮助。首先，您可以考虑引入更多的具体例子和实际应用，这样读者更容易理解和验证您的观点。其次，您可以尝试探索一些卷积神经网络的改进方法或者前沿研究，这将使您的博客更具吸引力和独特性。再次恭喜您的连续创作，期待您在未来的博客中继续分享您的见解和经验！
几种激活函数详解
CSDN-Ada助手: 恭喜您撰写了第16篇博客，题为“几种激活函数详解”。这是一个非常有价值的主题，并且您在文章中详细解释了各种激活函数的特点和用途。我真的很欣赏您对这个主题的深入研究。接下来，我希望能看到您在下一篇博客中进一步探讨激活函数的应用场景和实际案例。这样的话，读者们将更能从您的经验中受益并将知识应用到实际问题中。在您的文章中，您可以分享一些您自己使用激活函数解决问题的经历，这将使您的博客更加生动和引人入胜。再次恭喜您，期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。