34. 池化层 / 汇聚层

1. 池化层

在这里插入图片描述

如果我们拍摄黑白之间轮廓清晰的图像X,并将整个图像向右移动一个像素,即Z[i, j] = X[i, j + 1],则新图像Z的输出可能大不相同。而在现实中,随着拍摄角度的移动,任何物体几乎不可能发生在同一像素上。即使用三脚架拍摄一个静止的物体,由于快门的移动而引起的相机振动,可能会使所有物体左右移动一个像素(除了高端相机配备了特殊功能来解决这个问题)。

因此,引入汇聚(pooling)层,它具有双重目的:降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性。

2. 二维最大池化

池运算是确定性的,我们通常计算汇聚窗口中所有元素的最大值或平均值。这些操作分别称为最大汇聚层(maximum pooling)和平均汇聚层(average pooling)。

在这里插入图片描述

回到本节开头提到的对象边缘检测示例,现在我们将使用卷积层的输出作为2 * 2最大汇聚的输入。 设置卷积层输入为X,汇聚层输出为Y。 无论X[i, j]和X[i, j + 1]的值相同与否,或X[i, j + 1]和X[i, j + 2]的值相同与否,汇聚层始终输出Y[i, j] = 1。

也就是说,使用2 * 2最大汇聚层,即使在高度或宽度上移动一个元素,卷积层仍然可以识别到模式。

3. 填充,步幅和多个通道

  • 池化层与卷积层类似,都具有填充和步幅
  • 没有可学习的参数
  • 在每个输入通道应用池化层以获得相应的输出通道
  • 输出通道数 = 输入通道数

4. 平均池化层

在这里插入图片描述

5. 总结

  • 池化层返回窗口中最大或平均值
  • 缓解卷积层对位置的敏感性
  • 同样有窗口大小、填充和步幅作为超参数

6. 一些Q&A

Q1:池化层一般是放在卷积层后面吗?池化层能放在卷积层前面吗?
A1:通常语义上来说,池化层一般是放在卷积层后面

Q2:池化时,窗口有重叠和没有重叠影响如何?
A2:没什么影响,区别不大。

ps:池化层能减少运算量,但现在计算力越来越高,就越来越少的池化,例如Alphago就一个池化都没有

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
卷积池化层和全连接深度学习中常用的神经网络。它们在卷积神经网络(Convolutional Neural Network,CNN)中起着重要的作用。 1. 卷积(Convolutional Layer): 卷积CNN中最重要的之一。它通过使用卷积操作来提取输入数据的特征。卷积操作是指将一个滤波器(也称为卷积核)与输入数据进行逐元素相乘,并将结果相加得到输出特征图。卷积的主要作用是提取输入数据的局部特征,通过多个卷积核可以提取不同的特征。卷积还具有参数共享和稀疏连接的特点,使得网络可以更好地处理图像等结构化数据。 2. 池化层(Pooling Layer): 池化层是用于减小特征图尺寸的一种操作。它通过对输入数据的局部区域进行汇聚操作,例如最大池化或平均池化,来减少特征图的大小。池化层的主要作用是降低数据维度,减少计算量,并且具有一定程度的平移不变性,即对输入数据的微小变化不敏感。池化层通常与卷积交替使用,以提取更高级别的特征。 3. 全连接(Fully Connected Layer): 全连接是神经网络中最常见的之一。它将前一的所有神经元与当前的每个神经元相连接,每个连接都有一个权重。全连接的主要作用是将前一提取到的特征进行组合和整合,以便进行最终的分类或回归任务。全连接通常位于网络的最后几,用于将高级特征映射到最终的输出类别或数值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值