PyTorch中池化层的padding和ceil_mode参数设置

在池化操作的接口中,padding和ceil_mode这两个参数会影响到输出特征图的大小。padding即对特征图大小进行扩充的像素数量;ceil_mode指明,当剩余的像素不足滤波器大小,是否仍对这些像素进行运算。
对于池化操作来说,当stride为1时,希望输出与输入保持不变;当stride为2时,希望输出特征图的宽高均为输入的一半。下面以avg_pool2d讲解如何尽量简单达到上述目的:

import torch
import torch.nn.functional as f

y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=False)) # tensor([[[[3]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 6, 4]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=False)) # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 3, 6, 4]]]])

stride=2时:
若padding为0,则padding后仍为[1, 5, 4, 9]。第一次运算对[1, 5, 4]进行,得到3(向下取整);由于stride=2,则 第二次运算只剩[4, 9]这一个像素,小于kernel_size,此时,若ceil_mode=False,则直接不对剩余的部分运算,因此输出大小为1;若ceil_mode=True,则对剩余部分继续计算,取[4, 9]的均值6(向下取整),因此输出大小为2。若padding=1,PyTorch的默认padding值为0,则该维度上padding后为[0, 1, 5, 4, 9, 0],ceil_mode=False时,输出为[2, 6];ceil_mode=True时,输出为[2, 6, 4]。

stride=1时:
若padding=0,则输出为[3, 6];若padding=1,输入为[0, 1, 5, 4, 9, 0],输出为[2, 3, 6, 4]。stride=1时,ceil_mode的值不起作用,始终为False。

总结:

stride=2,padding=1或ceil__mode=True;stride=1时,必须有padding=1,ceil_mode的设置不起作用。

推广:

ceil_mode始终保持PyTorch的默认值False,且padding始终为kernel_size // 2。

PyTorch中池化操作还有一个与padding有关的参数count_include_pad,默认为True。意义是在运算(比如计算平均值或最大值)时,始终将padding的值纳入计算。

import torch
import torch.nn.functional as f
y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 6]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 3, 6, 4]]]])

如在上述例子中,stride=2,padding=1,ceil_mode=False时,若将count_include_pad设为False,则结果由[2, 6]变为[3, 6]。一般的,进行平均池化时,将该参数设为False;进行最大池化时,可保持默认不变,为True。

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值