12.1 认识MaxPool2d
本文中所学习的Pytorch官方文档地址link
主要参数
12.1.1 直观理解
与卷积类似,但是返回最大值。
可见最大池化的作用:减少数据量并保留数据特征。
12.2 ceil_mode的使用
ceil_mode (bool) – when True, will use ceil instead of floor to compute the output shape.默认为False.
12.2.1 直观理解
表现在对输入值的处理上—— ceil 模式下,向上取整;floor 模式下,向下取整
12.2.2 代码实现
由帮助文档可见输入为四个参数,故需要reshape
import torch
from torch import nn
from torch.nn import MaxPool2d
input = torch.tensor([[1, 2, 0, 3, 1],
[0, 1, 2, 3, 1],
[1, 2, 1, 0, 0],
[5, 2, 3, 1, 1],
[2, 1, 0, 1, 1]], dtype=torch.float32) # 将数据改成浮点型
input = torch.reshape(input, (-1, 1, 5, 5)) # batch_size未知时填“-1”,自动计算
print(input.shape)
class Avlon(nn.Module):
def __init__(self):
super().__init__()
self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=True) # stride默认值为 kernel_size
def forward(self, input):
output = self.maxpool1(input)
return output
avlon = Avlon()
output = avlon(input)
print(output)
# Python中很多操作不支持Long类型的张量, 只需要把输入的张量改成浮点类型即可
运行后
当"ceil_mode=False"时再次运行
可见与12.1.1中图片的结果一致。
12.3 使用Tensorboard展示
import torch
import torchvision
from torch import nn
from torch.nn import MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
dataset = torchvision.datasets.CIFAR10("../data", train=False, transform=torchvision.transforms.ToTensor(),
download=True)
dataloader = DataLoader(dataset, batch_size=64)
# input = torch.tensor([[1, 2, 0, 3, 1],
# [0, 1, 2, 3, 1],
# [1, 2, 1, 0, 0],
# [5, 2, 3, 1, 1],
# [2, 1, 0, 1, 1]], dtype=torch.float32) # 将数据改成浮点型
#
# input = torch.reshape(input, (-1, 1, 5, 5)) # batch_size未知时填“-1”,自动计算
# print(input.shape)
class Avlon(nn.Module):
def __init__(self):
super().__init__()
self.maxpool1 = MaxPool2d(kernel_size=3, ceil_mode=False)
def forward(self, input):
output = self.maxpool1(input)
return output
avlon = Avlon()
# output = avlon(input)
# print(output)
writer = SummaryWriter("../logs_maxpool")
step = 0
for data in dataloader:
imgs, targets = data
writer.add_images("input", imgs, step)
output = avlon(imgs) # 最大池化并没有改变通道数,故不需要reshape
writer.add_images("output", output, step)
step = step + 1
writer.close()
运行后
可见的确是保留了图片特征,并且大大减少了图片体积