深度学习笔记（25）池化层

最新推荐文章于 2023-10-30 14:28:22 发布

氢键H-H

最新推荐文章于 2023-10-30 14:28:22 发布

阅读量1.5w

点赞数 2

分类专栏：深度学习笔记文章标签： max pooling mean pooling 池化

本文为氢键H-H原创文章，未经允许请勿用于商业用途，转载请注明出处

本文链接：https://blog.csdn.net/qq_32618327/article/details/91347003

版权

深度学习笔记专栏收录该内容

52 篇文章 82 订阅

订阅专栏

深度学习笔记（25）池化层

1. max pooling
2. mean pooling
3. pooling 超参

1. max pooling

除了卷积层，卷积网络也经常使用池化层来缩减模型的大小，提高计算速度，同时提高所提取特征的鲁棒性
在这里插入图片描述
假如输入是一个4×4矩阵，用到的池化类型是最大池化（max pooling）
执行最大池化的树池是一个2×2矩阵

执行过程非常简单
把4×4的输入拆分成不同的区域，把这个区域用不同颜色来标记
对于2×2的输出，输出的每个元素都是其对应颜色区域中的最大元素值

最大池化的超参数：一个2×2矩阵，即 $f$ = 2，步幅是2，即 $s$ = 2
最大池化功能的直观理解:
可以把这个4×4区域看作是某些特征的集合
也就是神经网络中某一层的非激活值集合

数字大意味着可能探测到了某些特定的特征
左上象限具有的特征可能是一个垂直边缘，一只眼睛、或是CAP特征 ¹

显然左上象限中存在这个特征，这个特征可能是一只猫眼探测器
然而，右上象限并不存在这个特征

最大化操作的功能：
只要在任何一个象限内提取到某个特征，它都会保留在最大化的池化输出里

所以最大化运算的实际作用：
如果在过滤器中提取到某个特征，那么保留其最大值

如果没有提取到这个特征，可能在右上象限中不存在这个特征
那么其中的最大值也还是很小，这就是最大池化的直观理解

其中一个有意思的特点：
它有一组超参数，但并没有参数需要学习
实际上，梯度下降没有什么可学的
一旦确定了 $f$ 和 $s$ ，它就是一个固定运算，梯度下降无需改变任何值

在这里插入图片描述
如一个有若干个超级参数，输入是一个 5×5的矩阵
采用最大池化法，它的过滤器参数为3×3，即 $f$ = 3
步幅为1， $s$ = 1
输出矩阵是 3×3
之前的计算卷积层输出大小的公式同样适用于最大池化
即 $(n + 2 p - f) / s + 1$ ，这个公式也可以计算最大池化的输出大小

以上就是一个二维输入的最大池化的演示
如果输入是三维的，那么输出也是三维的
例如，输入是5×5×2，那么输出是3×3×2
计算最大池化的方法就是分别对每个通道执行刚刚的计算过程
一般来说，如果输入是 5×5×n_c，输出就是 3×3×n_c
n_c个通道中每个通道都单独执行最大池化计算

2. mean pooling

另外还有一种类型的池化，平均池化（mean pooling），但它不太常用
这种运算顾名思义，选取的不是每个过滤器的最大值，而是平均值

在这里插入图片描述
紫色区域的平均值是3.75，后面依次是1.25、4和2
这个平均池化的超级参数 $f$ = 2， $s$ = 2，也可选其它超级参数

目前来说，最大池化比平均池化更常用
但也有例外，就是深度很深的神经网络
可以用平均池化来分解规模为7×7×1000的网络的表示层
在整个空间内求平均值，得到1×1×1000

但在神经网络中，最大池化要比平均池化用得更多

3. pooling 超参

总结一下，池化的超级参数包括过滤器大小 $f$ 和步幅 $s$
常用的参数值为 $f$ = 2， $s$ = 2，应用频率非常高
其效果相当于高度和宽度缩减一半

也有使用 $f$ = 3， $s$ = 2，的情况
至于其它超级参数就要看用的是最大池化还是平均池化了

也可以根据自己意愿增加表示padding的其他超级参数，虽然很少这么用

最大池化时，往往很少用到超参数padding
当然也有例外的情况,目前 $p$ 最常用的值是0，即 $p$ = 0

最大池化的输入就是 n_H × n_W × n_c，假设没有padding
则输出
在这里插入图片描述
输入通道与输出通道个数相同，因为对每个通道都做了池化

需要注意的一点是，池化过程中没有需要学习的参数
执行反向传播时，反向传播没有参数适用于最大池化

只有这些设置过的超参数，可能是手动设置的，也可能是通过交叉验证设置的
最大池化只是计算神经网络某一层的静态属性
没有什么需要学习的，它只是一个静态属性

参考：

《神经网络和深度学习》视频课程

相关推荐：

深度学习笔记（24）卷积层
 深度学习笔记（23）卷积维度
 深度学习笔记（22） Padding
深度学习笔记（21）边缘检测
 深度学习笔记（20）端到端学习

谢谢！

一个分布式系统中Consistency（一致性）、 Availability（可用性）和Partition tolerance（分区容错性）不可兼 ↩︎

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习笔记（25）池化层

max pooling、mean pooling、pooling 超参
复制链接

扫一扫

专栏目录

氢键H-H

CSDN认证博客专家 CSDN认证企业博客

码龄9年

机器人开发领域优质创作者

401: 原创

2432: 周排名

606: 总排名

530万+: 访问

: 等级

3万+: 积分

3万+: 粉丝

1893: 获赞

765: 评论

5937: 收藏

私信

关注

热门文章

分类专栏

最新评论

STM32F103移植mpu9250
我要跑半马: 楼主能分享一下工程吗，1328564508@qq.com
ROS 消息过滤器MessageFilter
GUNDAM_EXIA_: 亲测ApproximateTimeSynchronizer可以同步雷达和相机的话题
Ubuntu 4G模块域名ping不通
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Ubuntu 4G模块域名ping不通
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
A*算法（二）启发式算法
weixin_50022426: 作者这里没有写清楚BFS是Best First Search（在上一篇文章写了）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

氢键H-H 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。