Pooling layers池化层中有许多函数,其中使用较多的就是最大池化MaxPool2d,本文结合代码简单讲解一下MaxPool2d的使用。
前言
最大池化MaxPool2d就是取池化核中的最大值,即池化核内的最大值为输出值。
可以这样理解:MaxPool的作用就是对某个Filter抽取到若干特征值,只取得其中最大的那个Pool层作为保留值,其他特征值全部抛弃,值最大代表只保留这些特征中最强的,抛弃其他弱的此类特征。
这样可以起到减少神经网络的数据量,简化数据,加快数据处理的作用。
一、MaxPool2d的官方文档
torch.nn.MaxPool2d(kernel_size,
stride=None,
padding=0,
dilation=1,
return_indices=False,
ceil_mode=False)
参数注释:
kernel_size – 最大的窗口大小,即池化核的大小
stride——窗口的步幅。 默认值为 kernel_size
padding – 要在两边添加隐式零填充
dilation – 控制窗口中元素步幅的参数
return_indices - 如果为 True,将返回最大索引以及输出。 以后对 torch.nn.MaxUnpool2d 有用
ceil_mode – 如果为 True,将使用 ceil 而不是 floor 来计算输出形状,ceil是向上取整,保留。如果是false,则是floor,向下取整,舍去,默认为false.
参数看上去是不是和卷积层中的Conv2d的使用很相似。下面我们来一起实例操作一下。
二、实例练习
1.数组练习
首先我们手动输入数组来练习一下,代码如下:
代码如下: import torch from torch import nn #输入tensor类型的5*5的一个数组 input = torch.tensor([[1, 2, 0, 3, 1], [0, 1, 2, 3, 1], [1, 2, 1, 0, 0], [5, 2, 3, 1, 1], [2, 1, 0, 1, 1]], dtype = torch.float) #输出这个尺寸只有(H,W),MaxPool2d需要的尺寸是(N, C, H, W),所以要进行转换 print(input.shape) #使用reshape进行转换 input = torch.reshape(input, (-1, 1, 5, 5)) #当我们不知道数量N时,可以给它一个-1, 它会根据后面的值推算出其值 print(input.shape) output1 = torch.nn.MaxPool2d(kernel_size=3) print(output1) #创建神经网络 class Test(nn.Module): #定义了一个神经网络,名字叫Test。然后它继承了nn.Module这个类。 def __init__(self): #初始化函数 super(Test, self).__init__() self.maxpool1 = torch.nn.MaxPool2d(kernel_size=3, ceil_mode=True) #进行最 大池化 def forward(self, input): outpuit2 = self.maxpool1(input) #数据input经过一次最大池化处理 return outpuit2 #返回结果 test = Test() #初始化 output2 = test(input) #运用神经网络处理数据 print(output2) 输出结果: torch.Size([5, 5]) torch.Size([1, 1, 5, 5]) MaxPool2d(kernel_size=3, stride=3, padding=0, dilation=1, ceil_mode=False) tensor([[[[2., 3.], [5., 1.]]]])
2.使用CIFAR10数据集练习
代码如下:
import torch.nn import torchvision from torch import nn from torch.utils.data import DataLoader from torch.utils.tensorboard import SummaryWriter #准备测试数据集 dataset = torchvision.datasets.CIFAR10("./dataset", train=False, transform=torchvision.transforms.ToTensor(), download=True) #使用dataloader数据迭代器,为模型提供数据 dataloader = DataLoader(dataset, batch_size=64, drop_last=False) #搭建神经网络 class Test(nn.Module): def __init__(self): super(Test, self).__init__() self.maxpool = torch.nn.MaxPool2d(kernel_size=3, stride=1, ceil_mode=False) def forward(self, x): x = self.maxpool(x) return x test = Test() #创建神经网络,初始化使用 #写入tensorboard中 writer = SummaryWriter("logs") #使用for循环 step = 0 for data in dataloader: imgs, target = data writer.add_images("input", imgs, global_step=step) #写入输入数据 output = test(imgs) writer.add_images("output", output, step) #写入输出数据 step = step + 1 writer.close()