【PyTorch】torch.nn.Sequential 类：按顺序将多个神经网络层组合成一个模型

彬彬侠

已于 2025-02-09 17:38:04 修改

阅读量1.2k

点赞数 24

分类专栏： PyTorch基础文章标签： Sequential 神经网络深度学习 pytorch python

于 2025-01-15 16:19:02 首次发布

本文链接：https://blog.csdn.net/u013172930/article/details/145162731

版权

PyTorch基础专栏收录该内容

101 篇文章

订阅专栏

`torch.nn.Sequential` 详解

torch.nn.Sequential 是 PyTorch 中一个非常方便的容器，用于按顺序将多个神经网络层组合成一个模型。它允许简单地通过按顺序添加层来构建深度学习模型，从而简化模型定义。

1. 作用

torch.nn.Sequential 提供了一个顺序容器，将多个子模块（通常是层）串联起来，按给定的顺序依次执行。它对于简单的线性堆叠模型非常有用，但对于更复杂的模型（如需要多个分支或跳跃连接的模型），可能就不适用了。

2. 基本语法

Sequential 接受一系列子模块（如层、激活函数、丢弃层等），这些模块将按照给定的顺序依次应用：

import torch
import torch.nn as nn

model = nn.Sequential(
    nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),  # 卷积层
    nn.ReLU(),  # 激活函数
    nn.MaxPool2d(kernel_size=2, stride=2),  # 最大池化层
    nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),  # 第二个卷积层
    nn.ReLU(),  # 激活函数
    nn.MaxPool2d(kernel_size=2, stride=2)  # 池化层
)

在这个例子中：

模型按顺序执行卷积、ReLU 激活、池化等操作。
Sequential 会自动将每一层的输入和输出连接起来，因此不需要显式地定义前向传播方法。

3. 使用方法

初始化：
Sequential 可以通过两种方式初始化：
1. 传入模块的构造函数（如 nn.Conv2d, nn.Linear 等）。
2. 传入已定义好的模块对象。
添加层：
你可以在 Sequential 中添加多个层，模块将按顺序执行这些操作。
访问每一层：
你可以通过 Sequential 模型的索引方式访问每一层。

4. 示例：经典卷积神经网络（CNN）模型

import torch
import torch.nn as nn

# 定义一个简单的CNN模型
model = nn.Sequential(
    nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),  # 卷积层
    nn.ReLU(),  # 激活函数
    nn.MaxPool2d(kernel_size=2, stride=2),  # 最大池化
    nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),  # 卷积层
    nn.ReLU(),  # 激活函数
    nn.MaxPool2d(kernel_size=2, stride=2),  # 最大池化
    nn.Flatten(),  # 拉平操作，将卷积输出展平
    nn.Linear(64*7*7, 128),  # 全连接层
    nn.ReLU(),  # 激活函数
    nn.Linear(128, 10)  # 输出层，假设有10个类别
)

# 打印模型架构
print(model)

5. `Sequential` 的灵活性

顺序结构：每一层（或者模块）按定义的顺序依次执行。
简化模型定义：对于一些简单的模型，Sequential 可以减少手动定义前向传播函数的麻烦。
修改模型：可以通过 model[i] 访问和修改其中的层。

6. 自定义 `forward()` 方法

对于一些复杂的网络结构，Sequential 可能不适用，因为它只支持按顺序执行操作。如果需要使用更多复杂的逻辑（如跳跃连接、分支结构等），则需要继承 nn.Module 并定义自定义的 forward() 方法。例如：

import torch
import torch.nn as nn

class CustomModel(nn.Module):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1)
        self.fc1 = nn.Linear(64*7*7, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = torch.relu(self.conv1(x))
        x = torch.max_pool2d(x, kernel_size=2, stride=2)
        x = torch.relu(self.conv2(x))
        x = torch.max_pool2d(x, kernel_size=2, stride=2)
        x = torch.flatten(x, 1)  # 拉平
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)  # 输出层
        return x

# 创建模型实例
model = CustomModel()

在这种情况下，forward() 方法中可以定义更复杂的逻辑，比如不同层之间的跳跃连接、共享层等。

7. 如何访问和修改模型中的层

你可以使用索引方式访问 Sequential 中的每一层，也可以直接修改模型中的某一层：

# 访问第一个层（卷积层）
print(model[0])  # 输出 Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))

# 修改模型的第一层
model[0] = nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1)