pytorch——MaxPool2d（最大池化）

最新推荐文章于 2024-03-16 21:51:55 发布

做程序员的第一天

最新推荐文章于 2024-03-16 21:51:55 发布

阅读量874

点赞数

分类专栏： pytorch 文章标签： pytorch 深度学习人工智能

本文链接：https://blog.csdn.net/m0_48241022/article/details/132089716

版权

pytorch 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

MaxPool2d

使用形式如下：

torch.nn.MaxPool2d(kernel_size, 
                   stride=None, padding=0, dilation=1, 
                   return_indices=False, ceil_mode=False)

官方文档给出的参数解释如下：

参数释义：

kernel_size：池化核的尺寸大小。

stride：池化核的步长，默认值为池化核的尺寸。

padding：输入图像周围的隐式填充。可以是单个数字或元组（padH、padW）。默认值：0，此时表示不填充。该参数解释可查看下文：

CSDNhttps://mp.csdn.net/mp_blog/creation/editor/132054470

dilation：一个参数，用于控制窗口中元素的步幅。例子如下：

dilation = 1时，有：

return_indices：该参数不经常使用，不作过多了解。

ceil_mode：若该参数取值为True，则在计算输出图像形状时会使用ceil模式而不是floor模式。ceil表示向上取整，即向正无穷靠拢，而floor是向下取整，即向负无穷靠拢。举例如下图所示：

该类模块输入输出为：

input的四个参数释义：

N：batch_size大小

C：通道数

Hin：输入图像高

Win：输入图像宽

output的四个参数释义：

N：batch_size大小

C：通道数

Hin：输出图像高

Win：输出图像宽

最大池化操作理论分析

给定如下输入图像及相应池化核，则输出结果为？

首先进行第一步匹配，如下图所示。

最大池化操作的过程是，在匹配后的框中寻找最大的数。经对比，可知最大数为2，则第一步结果为：

第二步匹配结果如下图所示。（假设stride取值为默认值，即池化核的尺寸大小，则池化核需要移动三个步长）

此时得到的结果需要取决于参数ceil_mode的取值，结果如下所示：（注：ceil_mode=True 即为保留；ceil_mode=False 即为舍弃）

下一步结果为：

在下一步结果为：

上右图也即为最终池化后的结果。

代码验证部分

ceil_mode = True时的代码如下所示。

import torch
# 输入图像信息
from torch import nn
from torch.nn import MaxPool2d

input = torch.tensor([[1, 2, 0, 3, 1],
                      [0, 1, 2, 3, 1],
                      [1, 2, 1, 0, 0],
                      [5, 2, 3, 1, 1],
                      [2, 1, 0, 1, 1]], dtype=torch.float)
input = torch.reshape(input, (-1, 1, 5, 5)) # -1表示自动计算batch_size的大小
# print(input.shape)

class Tudui(nn.Module):
    def __init__(self):
        super(Tudui, self).__init__()
        self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=True)

    def forward(self, input):
        output = self.maxpool1(input)
        return output

tudui = Tudui() # 创建神经网络
output = tudui(input)
print(output)

ceil_mode = True 时运行结果为：

tensor([[[[2., 3.],
          [5., 1.]]]])

ceil_mode = False 时运行结果为：

tensor([[[[2.]]]])

上述结果与理论部分结果一致。

做程序员的第一天

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pytorch——MaxPool2d（最大池化）

ceil_mode：若该参数取值为True，则在计算输出图像形状时会使用ceil模式而不是floor模式。最大池化操作的过程是，在匹配后的框中寻找最大的数。假设stride取值为默认值，即池化核的尺寸大小，则池化核需要移动三个步长。dilation：一个参数，用于控制窗口中元素的步幅。return_indices：该参数不经常使用，不作过多了解。ceil_mode = True时的代码如下所示。stride：池化核的步长，默认值为池化核的尺寸。kernel_size：池化核的尺寸大小。
复制链接

扫一扫