深度学习模型中的池化层

New Bear

已于 2024-07-30 19:20:22 修改

阅读量304

点赞数 5

分类专栏：深度学习基础文章标签：深度学习人工智能

于 2024-07-30 19:19:35 首次发布

本文链接：https://blog.csdn.net/New_Bear_1024/article/details/140804508

版权

深度学习基础专栏收录该内容

2 篇文章 0 订阅

订阅专栏

池化层（Pooling Layer）是卷积神经网络（CNN）中常用的一种操作，用于减少特征图的空间尺寸（即高度和宽度），从而减小模型的计算量和参数数量，同时保持重要的特征信息。池化层的主要作用包括降维、防止过拟合、提高计算效率以及增强特征的平移不变性。

一、常见的池化层类型

最大池化（Max Pooling）：
- 在特征图的每个局部区域中选择最大的值作为该区域的输出。
- 常用的最大池化操作是使用 2x2 的池化窗口和步幅为2。
平均池化（Average Pooling）：
- 在特征图的每个局部区域中计算平均值作为该区域的输出。
- 同样可以使用 2x2 的池化窗口和步幅为2。
全局池化（Global Pooling）：
- 对整个特征图进行池化，通常用于将特征图的空间维度缩减到1。常见的全局池化包括全局平均池化（Global Average Pooling）和全局最大池化（Global Max Pooling）。

二、池化层的参数

池化层通常有以下几个参数：

池化窗口大小（kernel_size）：池化操作的窗口大小，决定了局部区域的范围。
步幅（stride）：窗口在特征图上滑动的步长，决定了输出特征图的尺寸。
填充（padding）：在特征图的边缘添加额外的像素，以控制池化后特征图的尺寸。

三、PyTorch 中的池化层示例

最大池化（Max Pooling）：

import torch
import torch.nn as nn

# 定义最大池化层
max_pool = nn.MaxPool2d(kernel_size=2, stride=2)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.randn(1, 1, 4, 4)

# 应用最大池化层
output = max_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)

平均池化（Average Pooling）：

import torch
import torch.nn as nn

# 定义平均池化层
avg_pool = nn.AvgPool2d(kernel_size=2, stride=2)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.randn(1, 1, 4, 4)

# 应用平均池化层
output = avg_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)

全局平均池化（Global Average Pooling）：

import torch
import torch.nn as nn

# 定义全局平均池化层
global_avg_pool = nn.AdaptiveAvgPool2d(1)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.randn(1, 1, 4, 4)

# 应用全局平均池化层
output = global_avg_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)

示例分析

1. 最大池化

最大池化选择局部区域内的最大值，可以提取最显著的特征。下面的例子使用 2x2 的池化窗口和步幅为2，对 4x4 的输入特征图进行池化：

import torch
import torch.nn as nn

# 定义最大池化层
max_pool = nn.MaxPool2d(kernel_size=2, stride=2)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.tensor([[[[1.0, 2.0, 3.0, 4.0],
                               [5.0, 6.0, 7.0, 8.0],
                               [9.0, 10.0, 11.0, 12.0],
                               [13.0, 14.0, 15.0, 16.0]]]])

# 应用最大池化层
output = max_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)
print("输出特征图:", output)

平均池化
平均池化计算局部区域内的平均值，可以平滑特征图。使用同样的 2x2 的池化窗口和步幅为2，对 4x4 的输入特征图进行池化：

import torch
import torch.nn as nn

# 定义平均池化层
avg_pool = nn.AvgPool2d(kernel_size=2, stride=2)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.tensor([[[[1.0, 2.0, 3.0, 4.0],
                               [5.0, 6.0, 7.0, 8.0],
                               [9.0, 10.0, 11.0, 12.0],
                               [13.0, 14.0, 15.0, 16.0]]]])

# 应用平均池化层
output = avg_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)
print("输出特征图:", output)

全局平均池化
全局平均池化将每个通道的整个特征图缩减为一个值，常用于分类任务的最后一层：

import torch
import torch.nn as nn

# 定义全局平均池化层
global_avg_pool = nn.AdaptiveAvgPool2d(1)

# 创建输入张量 (batch_size, channels, height, width)
input_tensor = torch.tensor([[[[1.0, 2.0, 3.0, 4.0],
                               [5.0, 6.0, 7.0, 8.0],
                               [9.0, 10.0, 11.0, 12.0],
                               [13.0, 14.0, 15.0, 16.0]]]])

# 应用全局平均池化层
output = global_avg_pool(input_tensor)

print("输入尺寸:", input_tensor.shape)
print("输出尺寸:", output.shape)
print("输出特征图:", output)

结论

池化层在卷积神经网络中扮演着重要的角色，通过减少特征图的空间尺寸、降低计算复杂度、提高特征的平移不变性等，使得网络能够更有效地学习特征并提高性能。在设计网络架构时，合理使用池化层可以显著改善模型的性能和效率。

New Bear

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
深度学习模型中的池化层

池化层（Pooling Layer）是卷积神经网络（CNN）中常用的一种操作，用于减少特征图的空间尺寸（即高度和宽度），从而减小模型的计算量和参数数量，同时保持重要的特征信息。池化层的主要作用包括降维、防止过拟合、提高计算效率以及增强特征的平移不变性。
复制链接

扫一扫

专栏目录