10 应对loss为nan的问题

最新推荐文章于 2024-09-07 22:26:58 发布

饮哉

最新推荐文章于 2024-09-07 22:26:58 发布

阅读量321

点赞数 3

分类专栏：语音大创文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_73361455/article/details/140768050

版权

语音大创专栏收录该内容

10 篇文章 0 订阅

订阅专栏

应对loss为nan的问题

把学习率再调小一点

configs/experiment/vocals_dis.yaml里

降低学习率

把lr从0.000025改成 0.000005

梯度裁剪

原本是

trainer:
  devices: 4 # int or list
  sync_batchnorm: True
  track_grad_norm: 2
#  resume_from_checkpoint: /home/wujunyu/DTTNet-Pytorch/check_points/vocals_vocals_g32_10/checkpoints/last.ckpt
#  gradient_clip_val: 5

然后可以把gradient_clip_val: 5的注释去掉

修改模型

如果学习率改的很小还是nan，那么，模型里面可能梯度太大了，得调整一下模型的结构了（学习率太小学的很慢的）

PS：因为最后不打算做这个方向了，所以也没进一步修改模型。（肯定是得进一步修改模型的，激活函数，标准化函数，还有模型结构等等）

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
10 应对loss为nan的问题

PS：因为最后不打算做这个方向了，所以也没进一步修改模型。（肯定是得进一步修改模型的，激活函数，标准化函数，还有模型结构等等）如果学习率改的很小还是nan，那么，模型里面可能梯度太大了，得调整一下模型的结构了（学习率太小学的很慢的）把lr从0.000025改成 0.000005。
复制链接

扫一扫

专栏目录

博客等级

码龄2年

24
原创

145
点赞

150
收藏

137
粉丝

关注

私信

热门文章

分类专栏

语音大创 10篇
线段树 6篇

最新评论

## 操作系统进程调度练习题（书面）（搞懂此题搞懂全部）
饮哉: 这题其实挺怪的，不用扣细节，大致理解即可
简要学习vscode，cmake以及.json文件
CSDN-Ada助手: 恭喜您写下了第11篇博客！标题内容非常吸引人，我很高兴看到您对于学习vscode、cmake以及.json文件的简要总结。您的博客内容对于初学者来说一定非常有帮助。在下一步的创作中，我建议您可以更深入地探索vscode和cmake的相关功能，并结合实际案例进行详细的讲解。此外，您还可以分享一些您自己在使用这些工具时遇到的问题以及解决方法，这将为读者提供更全面的学习体验。再次恭喜您的持续创作，期待您未来更多精彩的博客！谢谢您的分享和努力！
UVA 10806 Dijkstra, Dijkstra
CSDN-Ada助手: “恭喜你写下了这篇关于UVA 10806 Dijkstra算法的博客！持续创作是非常了不起的，你的努力和热情让我们可以学习到更多有趣的知识。希望你可以继续分享更多关于算法的内容，或许可以尝试写一些实际应用的案例分析，或者分享一些自己的学习心得体会，这样可以让读者更加深入地理解和应用所学的知识。期待你的下一篇作品！”
UVA 1161 航程规划
CSDN-Ada助手: 恭喜您撰写了第9篇博客！看到您分享关于UVA 1161的航程规划，我感到非常兴奋。您对算法问题的深入理解和解析能够帮助读者更好地理解这个话题。在下一步的创作中，或许您可以考虑添加一些实例或案例分析，以更加生动地展示航程规划的应用场景。再次恭喜您的持续创作，期待更多有趣的博客！
P1438 无聊的数列
CSDN-Ada助手: 恭喜您写了第5篇博客，题目看起来很有趣呢！不过，或许您可以尝试写一些关于数列的实际应用，或者是数列在日常生活中的一些有趣的应用，这样可以让读者更加容易理解和接受您的内容。希望您能继续保持创作的热情，期待您更多精彩的作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。