报错：RuntimeError: Expected nested_tensorlist[0].size() ＞ 0 to be true, but got false. 已解决

最新推荐文章于 2024-09-04 10:31:20 发布

yu3jun

最新推荐文章于 2024-09-04 10:31:20 发布

阅读量607

点赞数 12

文章标签： python

本文链接：https://blog.csdn.net/ambitioustyj/article/details/136589229

版权

文章讨论了在训练深度学习模型时遇到的RuntimeError，原因可能是梯度裁剪时遇到零梯度。解决方法是检查模型参数的梯度存在性，仅对非零梯度进行裁剪。

摘要由CSDN通过智能技术生成

在训练深度学习模型时，遇到报错，RuntimeError: Expected nested_tensorlist[0].size() > 0 to be true, but got false. 谷歌搜索信息很少，有一条是说loss没有添加..backward()进行反向传播导致的，可见：
Expected nested_tensorlist[0].size() > 0 to be true, but got false - PyTorch Forums

但是我代码中有添加，询问gpt得到如下回答：

这个错误信息提示的问题是在尝试进行梯度裁剪时，遇到了一个或多个模型参数的梯度尺寸为零（即没有梯度）。这通常发生在以下几种情况：

未使用的参数：模型中可能存在一些未参与前向或反向传播的参数。例如，某些层可能因为模型的某种条件分支而没有被执行。
零梯度：某些参数在反向传播过程中可能得到了零梯度。这可能是因为模型的某部分没有得到有效的梯度更新。

解决这个问题的一种方法是在调用梯度裁剪之前，检查参数的梯度是否存在和有效。可以通过遍历模型参数并检查它们的 .grad 属性来实现。如果 .grad 是 None 或者梯度的尺寸为零，可以选择跳过这些参数的梯度裁剪。

修改代码如下，解决

loss.backward()
# nn.utils.clip_grad_value_(self.model.parameters(), clip_value=1.0)
for param in self.model.parameters():
    if param.grad is not None and param.grad.nelement() > 0:
        nn.utils.clip_grad_value_([param], clip_value=1.0)

yu3jun

关注

12
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
报错：RuntimeError: Expected nested_tensorlist[0].size() ＞ 0 to be true, but got false. 已解决

这个错误信息提示的问题是在尝试进行梯度裁剪时，遇到了一个或多个模型参数的梯度尺寸为零（即没有梯度）。解决这个问题的一种方法是在调用梯度裁剪之前，检查参数的梯度是否存在和有效。可以通过遍历模型参数并检查它们的。：模型中可能存在一些未参与前向或反向传播的参数。例如，某些层可能因为模型的某种条件分支而没有被执行。：某些参数在反向传播过程中可能得到了零梯度。这可能是因为模型的某部分没有得到有效的梯度更新。或者梯度的尺寸为零，可以选择跳过这些参数的梯度裁剪。
复制链接

扫一扫