torch 如何在迭代训练中，只计算参数梯度，不更新参数。并且将参数的梯度保存到列表，这个列表的值不随着梯度清零而跟着变为零

最新推荐文章于 2024-09-15 08:00:00 发布

高山莫衣

最新推荐文章于 2024-09-15 08:00:00 发布

阅读量909

点赞数 10

分类专栏： pytorch 文章标签： pytorch 深度学习人工智能

原创作品，共同进步！

本文链接：https://blog.csdn.net/AdamCY888/article/details/134776737

版权

pytorch 专栏收录该内容

66 篇文章

订阅专栏

本文介绍了如何在PyTorch中使用torch.autograd.backward()计算梯度时，通过设置requires_grad为False阻止参数更新，并通过grads_list保存计算出的梯度，以便在需要时保留梯度值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在使用 torch.autograd.backward() 计算梯度后，可以通过设置参数的 requires_grad 属性为 False 来阻止参数更新。同时，通过将计算出的梯度值放入一个列表中来保存，这个列表的值不会随着梯度清零而清零

在使用 torch.autograd.backward() 计算梯度后，可以通过设置参数的 requires_grad 属性为 False 来阻止参数更新。同时，通过将计算出的梯度值放入一个列表中来保存，这个列表的值不会随着梯度清零而清零。下面是一个示例代码：

import torch
# 定义网络和优化器
model = torch.nn.Linear(10, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
# 定义保存梯度的列表
grads_list = []
# 迭代训练过程
for i in range(10):
    # 获取数据并前向计算
    inputs, labels = get_data()
    outputs = model(inputs)
    # 计算损失函数并进行反向传播计算梯度
    loss = compute_loss(outputs, labels)
    model.zero_grad()
    loss.backward(retain_graph=True)
    # 保存梯度并更新优化器状态
    grads_list.append([p.grad.detach().clone() for p in model.parameters()])
    optimizer.step()
    # 在某些情况下需要清空梯度，但不影响保存下来的梯度值
    for p in model.parameters():
        p.grad = None

在上述代码中，我们首先定义了一个保存梯度的列表 grads_list，然后在每次迭代中使用 loss.backward() 计算梯度，并将计算出的梯度值放入 grads_list 中。由于我们在更新参数之前将所有参数的 requires_grad 属性设置为 False，所以这些参数不会被优化器更新。最后，我们清空梯度以便进行下一轮迭代，并通过 p.grad = None 来清除计算图中的梯度信息，但不影响保存下来的梯度值。