PyTorch实战指南：如何正确使用model.train()和model.eval()？

高斯小哥

已于 2023-12-29 00:23:47 修改

阅读量1.1w

点赞数 47

分类专栏： PyTorch 文章标签： pytorch 人工智能 python

于 2023-12-21 13:50:44 首次发布

本文链接：https://blog.csdn.net/qq_41813454/article/details/135128770

版权

PyTorch 专栏收录该内容

29 篇文章

订阅专栏

引言

在进行深度学习PyTorch实战的过程中，我们时常需要在训练和评估两种模式间切换。训练模式对应了模型的学习阶段，评估模式则是为了检验模型的性能。在PyTorch中，我们通过调用model.train()和model.eval()来实现这种切换。这两个方法的使用至关重要，因为它们会影响到某些层的运作方式，例如Dropout和BatchNorm。所以，理解并恰当运用这两个方法，对模型的优化至关重要。

训练模式 vs 评估模式

模式	前向传播	反向传播	参数更新	Dropout 层行为	BatchNorm 层行为
训练模式（Training Mode）	是	是	是	随机将一部分神经元关闭，以防止过拟合	使用每一批数据的均值和方差进行归一化处理
评估模式（Evaluation Mode）	是	否	否	关闭所有神经元，不再进行随机舍弃	使用在训练阶段计算得到的全局统计数据进行归一化处理。

训练模式（Training Mode）：如表格所示，在此模式下，模型会进行前向传播、反向传播以及参数更新。某些层，如Dropout层和BatchNorm层，在此模式下的行为会与评估模式下不同。例如，Dropout层会在训练过程中随机将一部分输入设置为0，以防止过拟合。
评估模式（Evaluation Mode）：如表格所示，在此模式下，模型只会进行前向传播，不会进行反向传播和参数更新。Dropout层会停止dropout，BatchNorm层会使用在训练阶段计算得到的全局统计数据，而不是测试集中的批统计数据。

在实战中使用model.train()和model.eval()

在PyTorch实战中，你可以通过以下方式将模型设置为训练模式或评估模式：

# 将模型设置为训练模式
model.train()

# 将模型设置为评估模式
model.eval()

需要注意的是，每当你开始一个新的训练或评估阶段时，你都应该明确地设置模型的模式。这是因为模型的模式不会随着你的操作自动切换。

示例代码

下面是一个简单的例子，展示了如何在训练和评估阶段使用model.train()和model.eval()：

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个简单的模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.fc1 = nn.Linear(10, 10)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(10, 1)
        self.dropout = nn.Dropout(0.5)
        
    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.dropout(x)  # 在训练和评估阶段行为不同
        x = self.fc2(x)
        return x

# 初始化模型、优化器和损失函数
model = SimpleModel()
optimizer = optim.SGD(model.parameters(), lr=0.01)
criterion = nn.MSELoss()

# 假设我们有一些训练数据和测试数据
train_data = torch.randn((100, 10))  # 训练数据，大小为(100, 10)
train_labels = torch.randn((100, 1))  # 训练标签，大小为(100, 1)
test_data = torch.randn((20, 10))  # 测试数据，大小为(20, 10)
test_labels = torch.randn((20, 1))  # 测试标签，大小为(20, 1)

# 训练阶段
model.train()  # 设置模型为训练模式
for epoch in range(10):  # 进行10个epoch的训练
    optimizer.zero_grad()  # 清空之前的梯度信息（如果有的话）
    outputs = model(train_data)  # 前向传播
    loss = criterion(outputs, train_labels)  # 计算损失
    loss.backward()  # 反向传播，计算梯度
    optimizer.step()  # 更新权重参数
    print(f'Epoch {epoch+1}, Loss: {loss.item()}')  # 打印损失信息

# 评估阶段
model.eval()  # 设置模型为评估模式
with torch.no_grad():  # 确保不会进行反向传播计算梯度，节省内存和计算资源
    test_outputs = model(test_data)  # 前向传播获取测试集的预测结果
    test_loss = criterion(test_outputs, test_labels)  # 计算测试集上的损失值
    print(f'Test Loss: {test_loss.item()}')  # 打印测试损失信息

在上述代码中，我们首先定义了一个简单的神经网络模型SimpleModel，并在训练和测试阶段分别使用model.train()和model.eval()来切换模型的模式。注意在评估阶段我们使用了with torch.no_grad():上下文管理器，以确保在评估阶段不会进行不必要的反向传播计算。

要点小结

模式切换：每次开始训练或评估前，确保调用model.train()或model.eval()。不恰当的模式可能导致性能下降或错误的结果。
Batch Normalization：BatchNorm层在训练和评估模式下的行为不同。在训练模式下，它使用mini-batch的统计数据进行标准化；在评估模式下，它使用在训练过程中计算得到的全局统计数据。
Dropout：Dropout层仅在训练期间随机将输入的一部分设置为0。在评估模式下，它不会进行dropout。
不需要梯度：在评估模式下，通常使用torch.no_grad():上下文管理器来确保不计算不必要的梯度，从而节省内存和计算资源。