记一次torch.backward()踩坑

章鱼花园啦啦啦

已于 2022-05-15 15:51:04 修改

阅读量534

点赞数

分类专栏：深度学习文章标签： pytorch 深度学习神经网络

于 2022-05-15 15:50:13 首次发布

本文链接：https://blog.csdn.net/lycacb1128/article/details/124783022

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在尝试使用Pytorch构建深度学习模型时，遇到一个反向传播过程中无法获取权重W和偏置b梯度的问题。原因是初始化权重和偏置时，乘以了0.01，使得它们被视为非叶节点。这导致在反向传播时不计算这些参数的梯度。解决方案是确保所有需要优化的参数require_grad属性设置正确。

摘要由CSDN通过智能技术生成

问题描述：

我尝试用Pytorch实现一个深度神经网络模型，在backward后尝试获取各层的W和b的梯度时报了一个这样的错误

原因分析：

在经过查找后，我发现require_grad为false的张量默认为叶张量，required_grad属性为True的分为两种情况，若为自己创建的，则为叶张量，若是经过计算得到的，则is_leaf属性为false。

经过查找自己初始化W和b的代码段：

    for i in range(L):
        parameters["W" + str(i + 1)] = torch.normal(0, 1, (layer_dim[i + 1], layer_dim[i]),
                                                    dtype=torch.float32, requires_grad=True) * 0.01
        parameters["b" + str(i + 1)] = torch.zeros((layer_dim[i + 1], 1), dtype=torch.float32,
                                                   requires_grad=True) * 0.01

在初始化的时候乘了一个0.01，导致W和b成为非叶节点，所以在反向传播时，并没有计算W和b的梯度。

章鱼花园啦啦啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
记一次torch.backward()踩坑

问题描述：我尝试用Pytorch实现一个深度神经网络模型，在backward后尝试获取各层的W和b时报了一个这样的错误原因分析：在经过查找后，我发现require_grad为false的张量默认为叶张量，required_grad属性为True的分为两种情况，若为自己创建的，则为叶张量，若是经过计算得到的，则is_leaf属性为false。经过查找自己初始化W和b的代码段： for i in range(L): parameters["W" + str(i + 1)] =
复制链接

扫一扫