SPP空间金字塔池化（spatial pyramid pooling, SPP)原理与pytorc实现

最新推荐文章于 2023-04-20 10:05:54 发布

wanghua609

最新推荐文章于 2023-04-20 10:05:54 发布

阅读量2.4k

点赞数 3

本文链接：https://blog.csdn.net/weixin_38145317/article/details/106471322

版权

1、为什么需要SPP？

过去的卷积神经网络CNN由卷积层+全连接层组成，其中卷积层对于输入数据的大小并没有要求，唯一对数据大小有要求的则是第一个全连接层，因此基本上所有的CNN都要求数据数据固定大小，例如著名的VGG模型则要求输入数据大小是（224×224）。

固定输入数据大小有两个问题：

1、很多场景所得到的数据并不是固定大小的，例如不同相机，不同手机，拍出来的图片其宽高比是不固定的;

2、有人说可以对图片进行切割，但是切割的话很可能会丢失到重要信息。

综上，SPP的提出就是为了解决CNN输入图像大小必须固定的问题，从而可以使得输入图像可以具有任意尺寸。

2、SPP原理

如图所示，对于选择的不同大小的区域对应到卷积之后的特征图上，得到的也是大小不一致的特征图区域，特征图通道数为256，对于每个区域，通过三种划分方式进行池化：

1）直接对整个整个区域池化，每层得到一个点，共256个点，构成一个1×256的向量;

2）将区域划分成2×2的格子，每个格子池化，得到一个1×256的向量，共2*2=4个格子，最终得到4个1×256的向量 ;

3）将区域划

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wanghua609

关注关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

空间金字塔池化改进 SPP / SPPF / SimSPPF / ASPP / RFB / SPPCSPC / SPPFCSPC / SPPELAN

YOLOv8项目贡献者

08-15

12万+

汇总一些SPP结构

空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch)

baidu_38634017的博客

07-19

1757

转载自：https://www.cnblogs.com/marsggbo/p/8572846.html 一、为什么需要SPP 首先需要知道为什么会需要SPP。我们都知道卷积神经网络(CNN)由卷积层和全连接层组成，其中卷积层对于输入数据的大小并没有要求，唯一对数据大小有要求的则是第一个全连接层，因此基本上所有的CNN都要求输入数据固定大小，例如著名的VGG模型则要求输入数据大小是 (224*22...

3 条评论您还未登录，请先登录后发表或查看评论

SPP Net 空间金字塔池化原理

村民的菜篮子

08-21

2305

首先对比一下RCNN和SPPNet的流程：上面是RCNN流程，下面是SPPNet流程。两者的共同点：都要先使用selective search选取可能的区域。两者的不同点：RCNN对选择出来的每个图像区域进行卷积，提取特征，而SPPnet使用共享卷积，对输入图像进行一次卷积即可，然后将选择出来的每个图像区域通过坐标映射，对应到特征图上。这是SPPnet的改进之处了，原来RCNN...

SPP(spatial pyramid pooling) 空间金字塔池化

weixin_47414034的博客

05-01

4515

网络往往要求输入是固定大小的数据，于是我们需要对不同大小的图片进行裁剪或者缩小到指定大小，这样会导致部分信息丢失。SPP可以让网络适应任意大小的输入图片。 SPP还可以和空洞卷积相结合，得到ASPP(atrous spatial pyramid pooling） ...

空间金字塔池化(Spatial Pyramid Pooling, SPP)原理及代码实现(Pytorch)

Viraha_的博客

03-20

2598

空间金字塔池化(Spatial Pyramid Pooling, SPP)原理及代码实现(Pytorch) 卷积神经网络(CNN)由卷积层和全连接层组成，其中卷积层对于输入数据的大小并没有要求，唯一对数据大小有要求的则是第一个全连接层，因此基本上所有的CNN都要求输入数据固定大小，例如著名的VGG模型则要求输入数据大小是 (224*224) 。固定输入数据大小有两个问题： 1.很多场景所得到数据并不是固定大小的，例如街景文字基本上其高宽比是不固定的。 2.可能你会说可以对图片进行切割，但是切割的话很可能

空间金字塔池化（Spatial Pyramid Pooling, SPP）原理和代码实现（Pytorch）

qq_42052229的博客

05-22

4715

一、为什么需要SPP 首先需要知道为什么需要SPP。我们都知道卷积神经网络(CNN)由卷积层和全连接层组成，其中卷积层对于输入数据的大小并没有要求，唯一对数据大小有要求的则是第一个全连接层，因此基本上所有的CNN都要求输入数据固定大小，例如著名的VGG模型则要求输入数据大小是 (224*224) 。固定输入数据大小有两个问题：很多场景所得到数据并不是固定大小的，例如街景文字基本上其高宽比是不...

SPP Net 空间金字塔池化(Spatial Pyramid Pooling, SPP)原理

11-03

3957

最近从头捋一下R-CNN系列的目标检测算法，在R-CNN首次将CNN与目标检测练习到一起之后，为了弥补它效率慢、不是端到端的神经网络、输入图片大小resize不准确等问题，各路神仙在后面陆续推出了SPP Net、Fast R-CNN、Faster R-CNN、R-FCN等R-CNN系列的模型。在我将R-CNN弄清楚原理及流程之后就开始学习何凯明团队推出的SPP Net的网络模型。SPP Net的核心思想是空间金字塔池化(Spatial Pyramid Pooling, S...

空间金字塔池化 spatial pyramid pooling（spp）

mn08290125的博客

10-09

801

空间金字塔池化（spatial pyramid pooling）是把经过CNN（提特征）之后形成的任意不同尺寸的feature map转变成相同大小的特征向量，然后送入全连接网络fc中整体过程：Image -->cnn（进行提特征）–>spp -->fc ...

Spatial Pyramid Pooling（空间金字塔池化）-变尺度CNN训练

热门推荐

沈春旭的博客

09-08

2万+

1. 需求创造好的产品，产品拓宽原始的需求当前的深度神经网络一般都需要固定的输入图像尺寸（如224*224）. 这种需求很明显是人为的，潜在性的弊端会降低识别精度（为了使图像尺寸相同，一定会涉及到图像的比例/非比例放缩，这就引入了尺度误差和形变误差）。何凯明师兄的这项工作主要是讲多分辨率搜索的思想融入到了现有的深度网络中，从而实现了多尺度网络的训练以及识别，进而提升了图像分类和目标检测的精度（...

SPP空间金字塔池化

吹啊~吹啊~大风吹~~

04-04

751

Fast R-CNN论文解读-将RCNN的多段训练合并为一段，使用RoI池化层统一尺度-最大优点是训练与检测速度快

appleclub666的博客

10-09

1753

作者：WXY 日期：2020-9-5 论文期刊：Ross Girshick Microsoft Research Sep 2015 标签：Fast RCNN 一、写在前面的话 Fast R-CNN基于之前的RCNN，用于高效地目标检测，运用了一些新的技巧，是训练速度、测试速度、准确率都提升。Fast R-CNN训练了一个VGG 16网络，但训练速度比RCNN快9被，测试速度快213倍，同时在PASCAL VOC上有更高的准确率，相比SPPnet，它的训练速度快3倍，测试速度快10倍。之前的模型为了实现目标

空间金字塔池化（Spatial Pyramid Pooling）

酒酿小圆子呀～

04-20

2790

上面这个图可以看出SPPnet和RCNN的区别，首先是输入不需要放缩到指定大小。其次是增加了一个空间金字塔池化层，还有最重要的一点是每幅图片只需要提取一次特征。SPPnet虽然解决了CNN输入任意大小图片的问题，但是还是需要重复为每个region proposal提取特征啊，能不能我们直接根据region proposal定位到他在卷积层特征的位置，然后直接对于这部分特征处理呢？答案是肯定的。

spp原理不同尺寸图片池化为相同尺寸

蜗牛在听雨的博客

07-09

533

yolo系列学习笔记----yolov4（SPP原理）

YOULANSHENGMENG的博客

12-13

1万+

1，概述 YOLOv4模型由以下部分组成： CSPDarknet53作为骨干网络BackBone； SPP作为Neck的附加模块，PANet作为Neck的特征融合模块； YOLOv3作为Head。 yolov3的结构如如下：

SPPNet——空间金字塔池化

qq_37053885的博客

08-18

2375

论文链接：https://arxiv.org/pdf/1406.4729.pdf 一、SPPNet简介 SPP就是在卷积神经网络的卷积层和第一层全连接层之间加入一层空间金字塔池化层，时使得网络可以接受任意尺寸的图片作为输入。不采用SPP的一般卷积神经网络都得要求输入的图片具有固定的尺寸，因为经过最后一层卷积层到第一层全连接层的过程中需要把卷积层以及池化层提取到的特征进行flatten，然后...

SPP论文原理理解

qq_35608277的博客

05-04

1230

改进在检测上，改进R-CNN：用金字塔池化代替wrap，只对图像进行一次卷积，大大缩短rcnn卷积耗时。原理使用spatial pyramid layer在特征图上提取特征，可以将任意大小的图像池化生成固定长度的图像表示，以适应FC layer。（任意尺寸输入，固定大小输出）输入：宽高为w,hconv5的特征图输出：维度K*M（适应FC的尺寸，根据需要自由设定） ...

深度学习基础--池化--空间金字塔池化(spatial pyramid pooling,SPP)

wydbyxr的博客

11-15

3211

空间金字塔池化(spatial pyramid pooling,SPP) 解决的问题先前方法，输入图片会经过裁切（Crop）或者变形缩放（Warp），这都在一定程度上导致图片信息的丢失和变形，限制了识别精确度。 SPP可以输入任意大小的图片（不需要经过裁剪缩放等操作，去除网络输入是固定大小的限制），输出固定长度的representation（一维特征向量）。意义 R-CNN是直接从...

金字塔池化过程及其优势

知其不可为而为之

05-23

1万+

金字塔池化过程及其优势第一次完全自己动手写博文，起初有点不知所措，后来是有种深深的责任感，经过查阅了一些资料，才敢动笔，可能有些地方没有完全领悟到，期望各位同仁予以指正。虽然在池化总结（OverlappingPooling、一般池化、Spatial Pyramid Pooling）一文中简单地介绍过金字塔池化（SPP），这次主要针对SPP实现原理和细节进行说明。本文主要基于Spati

空间金字塔池化(Spatial Pyramid Pooling, SPP)