池化层输出数据的维度计算公式

池化层(Pooling Layer)在卷积神经网络中常用于下采样。池化操作有助于减少模型的参数量和计算量,并防止过拟合。池化层常见的类型包括最大池化(Max Pooling)和平均池化(Average Pooling)。计算池化层输出数据的维度时,通常考虑以下几个因素:

  1. 输入数据的维度(输入特征图的高度 H in H_{\text{in}} Hin 和宽度 W in W_{\text{in}} Win)。
  2. 池化窗口的大小(高度 k H k_H kH 和宽度 k W k_W kW)。
  3. 池化的步长(高度方向的步长 s H s_H sH 和宽度方向的步长 s W s_W sW)。
  4. 填充(padding),表示在输入的边缘填充的像素数(高度方向的填充 p H p_H pH 和宽度方向的填充 p W p_W pW)。

假设输入特征图的尺寸为 H in × W in H_{\text{in}} \times W_{\text{in}} Hin×Win,池化窗口的大小为 k H × k W k_H \times k_W kH×kW,步长为 s H × s W s_H \times s_W sH×sW,填充为 p H × p W p_H \times p_W pH×pW,池化层输出特征图的高度 H out H_{\text{out}} Hout 和宽度 W out W_{\text{out}} Wout 可以通过以下公式计算:

H out = ⌊ H in − k H + 2 p H s H ⌋ + 1 H_{\text{out}} = \left\lfloor \frac{H_{\text{in}} - k_H + 2p_H}{s_H} \right\rfloor + 1 Hout=sHHinkH+2pH+1

W out = ⌊ W in − k W + 2 p W s W ⌋ + 1 W_{\text{out}} = \left\lfloor \frac{W_{\text{in}} - k_W + 2p_W}{s_W} \right\rfloor + 1 Wout=sWWinkW+2pW+1

其中, ⌊ ⋅ ⌋ \lfloor \cdot \rfloor 表示向下取整操作。

举个例子,假设输入特征图的尺寸为 32 × 32 32 \times 32 32×32,池化窗口的大小为 2 × 2 2 \times 2 2×2,步长为 2 × 2 2 \times 2 2×2,不使用填充(即 p H = p W = 0 p_H = p_W = 0 pH=pW=0),则池化层输出特征图的高度和宽度计算如下:

H out = ⌊ 32 − 2 + 0 2 ⌋ + 1 = ⌊ 15 ⌋ + 1 = 16 H_{\text{out}} = \left\lfloor \frac{32 - 2 + 0}{2} \right\rfloor + 1 = \left\lfloor 15 \right\rfloor + 1 = 16 Hout=2322+0+1=15+1=16

W out = ⌊ 32 − 2 + 0 2 ⌋ + 1 = ⌊ 15 ⌋ + 1 = 16 W_{\text{out}} = \left\lfloor \frac{32 - 2 + 0}{2} \right\rfloor + 1 = \left\lfloor 15 \right\rfloor + 1 = 16 Wout=2322+0+1=15+1=16

因此,池化层输出的特征图尺寸为 16 × 16 16 \times 16 16×16

  • 21
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值