【Torch】解决tensor参数有梯度,weight不更新的若干思路

问题:

           在torch类里面用nn.Parameter声明了一个可学的Tensor参数, 结果每次梯度回传之后,可以看到变量梯度,但是该参数的weight始终不变,一直保持着初始值。

思路:

遇到某参数的weight一直不更新,解决思路有以下几种:

1.   检查该变量的梯度是否为0或者为None, 对于pytorch的中间变量,输出梯度的方式见博客:  https://www.jianshu.com/p/ad66f2e38f2f

      如果是None或者0,说明梯度没有传到该变量,顺着代码往下一直输出变量的梯度,直到梯度出现为止,然后检查为啥梯度消失了。

2.  输出梯度后, 检查梯度乘上学习率是否过小, 比如梯度为5e-2,学习率为1e-4,而变量的值只保留五位小数,那么此时由于学习率过小使得更新被变量忽略,需要把学习率调高。

 

3.  检查该变量是否在optimal step函数之前被替换, 即梯度回传之后, step函数之前,该参数被重新赋值。

 

4. 最重要的是, 检查参数所在的类,是否加入了optimal的优化参数序列中:(, 不然梯度虽然回传了,但优化器并不会对你的参数产生反应。 

      如果是一个模型类的列表: 请不要用list类型,使用nn.ModuleList , 如果一个list中包含了三个A类, 把list作为B类的参数的时候(在init函数中赋值),那么这个list里面所有的参数(A类中的参数)都不会被优化, 使用nn.ModuleList可以避免这一点。

 

大概尝试的思路就这么多, 有遗漏的请路过大佬在评论区指正。

如上

 

  • 19
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
PyTorch是一个非常流行的深度学习框架,可以用来训练各种类型的神经网络。在训练神经网络时,了解模型参数梯度值对于优化模型非常重要。在PyTorch中,可以通过调用模型对象的"backward()"方法来计算模型参数梯度。具体来说,可以按照以下步骤查看模型参数梯度: 1. 创建一个PyTorch模型,例如一个多层感知器。 2. 运行一些输入数据,并将输出和真实标签传递给损失函数。 3. 在完成一次前向传递和反向传递后,可以通过调用"backward()"方法计算所有参数梯度值。 4. 最后,可以通过访问参数对象的"grad"属性来获取每个参数梯度值。 例如,如果想要查看模型的第二个全连接层的权重参数梯度值,可以使用以下代码: ```python import torch import torch.nn as nn # 创建模型 class MLP(nn.Module): def __init__(self): super(MLP, self).__init__() self.fc1 = nn.Linear(784, 256) self.fc2 = nn.Linear(256, 128) self.fc3 = nn.Linear(128, 10) def forward(self, x): x = x.view(-1, 784) x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x)) x = self.fc3(x) return x model = MLP() # 前向传播和反向传播 input = torch.randn((64, 1, 28, 28)) output = model(input) target = torch.randn((64, 10)) criterion = nn.MSELoss() loss = criterion(output, target) loss.backward() # 查看参数梯度 print(model.fc2.weight.grad) ``` 这将输出第二个全连接层的权重参数梯度,该层包括128个输入和256个输出: ```python tensor([[-0.0005, -0.0005, -0.0005, ..., -0.0005, -0.0005, -0.0005], [-0.0008, -0.0008, -0.0008, ..., -0.0008, -0.0008, -0.0008], [-0.0011, -0.0011, -0.0011, ..., -0.0011, -0.0011, -0.0011], ..., [-0.0009, -0.0009, -0.0009, ..., -0.0009, -0.0009, -0.0009], [-0.0009, -0.0009, -0.0009, ..., -0.0009, -0.0009, -0.0009], [-0.0003, -0.0003, -0.0003, ..., -0.0003, -0.0003, -0.0003]]) ``` 总之,通过使用PyTorch中的"backward()"方法和参数对象的"grad"属性,可以轻松地查看模型参数梯度值。这对于分析和优化深度学习模型非常有用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值