【PyTorch】nn.MaxPool2d函数详解

望天边星宿

已于 2022-10-28 10:58:48 修改

阅读量1.7w

点赞数 7

分类专栏： PyTorch 深度学习文章标签： pytorch 深度学习机器学习

于 2022-10-28 10:11:43 首次发布

本文链接：https://blog.csdn.net/see_star/article/details/127565842

版权

深度学习同时被 2 个专栏收录

34 篇文章 10 订阅

订阅专栏

PyTorch

4 篇文章 0 订阅

订阅专栏

文章目录

1. 函数语法格式
2. 参数解释
3. 尺寸关系
4. 使用案例
5. nn.functional.max_pool2d

1. 函数语法格式

官方链接

torch.nn.MaxPool2d(
	kernel_size, 
	stride=None, 
	padding=0, 
	dilation=1, 
	return_indices=False, 
	ceil_mode=False
)

2. 参数解释

kernel_size (int or tuple)【必选】：max pooling 的窗口大小，当最大池化窗口是方形的时候，只需要一个整数边长即可；最大池化窗口不是方形时，要输入一个元组表高和宽。
stride (int or tuple, optional)【可选】：max pooling 的窗口移动的步长。默认值是 kernel_size
padding (int or tuple, optional)【可选】：输入的每一条边补充0的层数
dilation (int or tuple, optional)【可选】：一个控制窗口中元素步幅的参数
return_indices (bool)【可选】：如果等于 True，会返回输出最大值的序号，对于上采样操作会有帮助
ceil_mode (bool)【可选】：如果等于True，计算输出信号大小的时候，会使用向上取整，代替默认的向下取整的操作

⭐ dilation 说明

如果我们设置的 dilation=0 的话，效果如图：蓝色为输入，绿色为输出，最大池化窗口为3 × 3

在这里插入图片描述

如果设置的是dilation=1，那么效果如图：蓝色为输入，绿色为输出，最大池化窗口卷积核仍为 3 × 3 。

在这里插入图片描述

3. 尺寸关系

输入可以为： $N,C_{in},H_{in},W_{in})$ 或 $C_{in},H_{in},W_{in})$
输出可以为： $N,C_{out},H_{out},W_{out})$ 或 $C_{out},H_{out},W_{out})$

它们之间的关系为：
$H_{out}=\left\lfloor\frac{H_{in}+2 \times padding[0]-dilation[0] \times(kernel\_size[0]-1)-1}{ stride [0]}+1\right\rfloor$

$W_{out}=\left\lfloor\frac{W_{in}+2 \times padding[1]-dilation[1] \times(kernel\_size[1]-1)-1}{ stride [1]}+1\right\rfloor$

4. 使用案例

# pool of square window of size=3, stride=2
m = nn.MaxPool2d(3, stride=2)
# pool of non-square window
m = nn.MaxPool2d((3, 2), stride=(2, 1))
input = torch.randn(20, 16, 50, 32)
output = m(input)

5. nn.functional.max_pool2d

官网链接

⭐ 区别

torch.nn.MaxPool2d 和 torch.nn.functional.max_pool2d，在 pytorch 构建模型中，都可以作为最大池化层的引入，但前者为类模块，后者为函数，在使用上存在不同。

⭐ 使用

torch.nn.functional.max_pool2d(
	input, 
	kernel_size, 
	stride=None, 
	padding=0, 
	dilation=1, 
	ceil_mode=False, 
	return_indices=False
)

望天边星宿

关注

7
点赞
踩
69

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录