三维最大池化计算输出

torch.Size([4, 64, 8, 112, 112])是输入,x_rgb = self.rgb_path.maxpool(x_rgb)是最大池化,MaxPool3d(kernel_size=(1, 3, 3), stride=(1, 2, 2), padding=(0, 1, 1), dilation=1, ceil_mode=False)是结构,输出是多少?

来计算一下这个最大池化层的输出尺寸。

输入尺寸:

  • torch.Size([4, 64, 8, 112, 112])
    • Batch 大小: 4
    • 输入通道数: 64
    • 输入深度: 8
    • 输入高度: 112
    • 输入宽度: 112

最大池化层结构:

  • MaxPool3d(kernel_size=(1, 3, 3), stride=(1, 2, 2), padding=(0, 1, 1), dilation=1, ceil_mode=False)
    • 核大小: (1, 3, 3)
    • 步长: (1, 2, 2)
    • 填充: (0, 1, 1)
    • dilation: 1
    • ceil_mode: False

根据三维最大池化的计算公式:

  1. 输出深度:
    D_out = floor((D_in + 2 * padding[0] - (kernel_size[0] - 1) - 1) / stride[0]) + 1
         = floor((8 + 2 * 0 - (1 - 1) - 1) / 1) + 1
         = 8

  2. 输出高度:
    H_out = floor((H_in + 2 * padding[1] - (kernel_size[1] - 1) - 1) / stride[1]) + 1
         = floor((112 + 2 * 1 - (3 - 1) - 1) / 2) + 1
         = 56

  3. 输出宽度:
    W_out = floor((W_in + 2 * padding[2] - (kernel_size[2] - 1) - 1) / stride[2]) + 1
         = floor((112 + 2 * 1 - (3 - 1) - 1) / 2) + 1
         = 56

综上所述,经过这个最大池化层后,输出特征图的尺寸为 (4, 64, 8, 56, 56)

 发现手动计算和程序自动计算的是一致的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值