神经网络——Pooling layers中最大池化MaxPool2d的使用

晓亮.

已于 2022-06-06 18:53:04 修改

阅读量4.7k

点赞数 2

文章标签：神经网络 python 人工智能 cnn 深度学习

于 2022-06-02 08:08:52 首次发布

本文链接：https://blog.csdn.net/m0_51816252/article/details/125093886

版权

Pooling layers池化层中有许多函数，其中使用较多的就是最大池化MaxPool2d，本文结合代码简单讲解一下MaxPool2d的使用。

前言

最大池化MaxPool2d就是取池化核中的最大值，即池化核内的最大值为输出值。

可以这样理解：MaxPool的作用就是对某个Filter抽取到若干特征值，只取得其中最大的那个Pool层作为保留值，其他特征值全部抛弃，值最大代表只保留这些特征中最强的，抛弃其他弱的此类特征。这样可以起到减少神经网络的数据量，简化数据，加快数据处理的作用。

一、MaxPool2d的官方文档

torch.nn.MaxPool2d(kernel_size,
stride=None,
padding=0,
dilation=1,
return_indices=False,
ceil_mode=False)

参数注释：

kernel_size – 最大的窗口大小，即池化核的大小

stride——窗口的步幅。默认值为 kernel_size

padding – 要在两边添加隐式零填充

dilation – 控制窗口中元素步幅的参数

return_indices - 如果为 True，将返回最大索引以及输出。以后对 torch.nn.MaxUnpool2d 有用

ceil_mode – 如果为 True，将使用 ceil 而不是 floor 来计算输出形状，ceil是向上取整，保留。如果是false,则是floor,向下取整，舍去，默认为false.

参数看上去是不是和卷积层中的Conv2d的使用很相似。下面我们来一起实例操作一下。

二、实例练习

1.数组练习

首先我们手动输入数组来练习一下，代码如下：

代码如下：
import torch
from torch import nn

#输入tensor类型的5*5的一个数组
input = torch.tensor([[1, 2, 0, 3, 1],
                     [0, 1, 2, 3, 1],
                     [1, 2, 1, 0, 0],
                     [5, 2, 3, 1, 1],
                     [2, 1, 0, 1, 1]], dtype = torch.float)

#输出这个尺寸只有(H,W),MaxPool2d需要的尺寸是（N, C, H, W）,所以要进行转换
print(input.shape)

#使用reshape进行转换
input = torch.reshape(input, (-1, 1, 5, 5))    #当我们不知道数量N时，可以给它一个-1，
它会根据后面的值推算出其值
print(input.shape)

output1 = torch.nn.MaxPool2d(kernel_size=3)
print(output1)

#创建神经网络
class Test(nn.Module):    #定义了一个神经网络，名字叫Test。然后它继承了nn.Module这个类。
    def __init__(self):        #初始化函数
        super(Test, self).__init__()
        self.maxpool1 = torch.nn.MaxPool2d(kernel_size=3, ceil_mode=True)      #进行最
大池化

    def forward(self, input):
        outpuit2 = self.maxpool1(input)       #数据input经过一次最大池化处理
        return outpuit2                #返回结果

test = Test()             #初始化
output2 = test(input)         #运用神经网络处理数据
print(output2)


输出结果：
torch.Size([5, 5])
torch.Size([1, 1, 5, 5])
MaxPool2d(kernel_size=3, stride=3, padding=0, dilation=1, ceil_mode=False)
tensor([[[[2., 3.],
          [5., 1.]]]])

2.使用CIFAR10数据集练习

代码如下：

import torch.nn
import torchvision
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

#准备测试数据集
dataset = torchvision.datasets.CIFAR10("./dataset", train=False, transform=torchvision.transforms.ToTensor(),
                                       download=True)
#使用dataloader数据迭代器，为模型提供数据
dataloader = DataLoader(dataset, batch_size=64, drop_last=False)


#搭建神经网络
class Test(nn.Module):
    def __init__(self):
        super(Test, self).__init__()
        self.maxpool = torch.nn.MaxPool2d(kernel_size=3, stride=1, ceil_mode=False)

    def forward(self, x):
        x = self.maxpool(x)
        return x

test = Test()   #创建神经网络，初始化使用

#写入tensorboard中
writer = SummaryWriter("logs")

#使用for循环
step = 0
for data in dataloader:
    imgs, target = data
    writer.add_images("input", imgs, global_step=step)   #写入输入数据
    output = test(imgs)
    writer.add_images("output", output, step)     #写入输出数据
    step = step + 1

writer.close()