深度学习中检查模型梯度是否发生变化

nsq_ai

于 2024-08-12 18:32:06 发布

阅读量119

点赞数 5

分类专栏： python bug 文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/weixin_45063703/article/details/141138988

版权

python bug 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前言

要检查模型的梯度是否发生变化，在进行梯度更新操作（如反向传播）之前和之后，分别查看模型参数的梯度。这通常涉及以下几个步骤：

确保模型处于训练模式。
进行一次前向传播和损失计算。
在反向传播之前，保存参数的梯度状态（如果是第一次反向传播，梯度应该是None或者初始状态）。
进行反向传播。
比较反向传播前后的梯度。

代码

以下是一个简单的示例，展示了如何检查PyTorch模型中某个参数的梯度是否发生变化：

import torch
import torch.nn as nn

# 定义一个简单的模型
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.linear = nn.Linear(10, 1)

    def forward(self, x):
        return self.linear(x)

# 实例化模型并设置为训练模式
model = SimpleModel()
model.train()

# 创建一个随机的输入和目标张量
x = torch.randn(1, 10)
target = torch.randn(1, 1)

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

# 第一次前向传播和损失计算
output = model(x)
loss = criterion(output, target)

# 检查梯度（应该是None，因为还没有进行反向传播）
print("Gradients before backward:")
for name, param in model.named_parameters():
    print(name, param.grad)  # 应该输出None或者之前的梯度值（如果有的话）

# 反向传播，计算梯度
optimizer.zero_grad()  # 清空之前的梯度
loss.backward()  # 反向传播，计算当前梯度

# 检查梯度（现在应该有具体的梯度值）
print("Gradients after backward:")
for name, param in model.named_parameters():
    print(name, param.grad)  # 应该输出具体的梯度值

首先创建了一个简单的线性模型
然后进行了一次前向传播和损失计算。
在反向传播之前，打印了模型参数的梯度，它们应该是None（如果是第一次进行梯度计算）或者显示之前的梯度值（如果之前已经进行过梯度计算且没有清零）。
接着，执行反向传播并再次打印梯度，这时应该能看到具体的梯度值，表明梯度已经发生了变化。

小结

在每次反向传播之前使用optimizer.zero_grad()或model.zero_grad()（如果定义了该方法）来清空之前的梯度是很重要的，否则新的梯度将会与旧的梯度累加。

nsq_ai

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习中检查模型梯度是否发生变化

要检查模型的梯度是否发生变化，在进行梯度更新操作（如反向传播）之前和之后，分别查看模型参数的梯度。确保模型处于训练模式。进行一次前向传播和损失计算。在反向传播之前，保存参数的梯度状态（如果是第一次反向传播，梯度应该是None或者初始状态）。进行反向传播。比较反向传播前后的梯度。
复制链接

扫一扫