训练神经网络出现nan

崧小果

已于 2024-10-08 22:31:04 修改

阅读量760

点赞数 14

分类专栏： AI学习记录文章标签：神经网络深度学习机器学习

于 2024-10-08 17:20:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61175448/article/details/142761157

版权

AI学习记录专栏收录该内容

5 篇文章 0 订阅

订阅专栏

在理解和修改QARV的代码时，出现了训练会因为nan而终止的问题，因此学习记录。

参考资料

Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因Pytorch训练模型损失Loss为Nan或者无穷大（INF）原因_pytorch nan-CSDN博客文章浏览阅读5.6w次，点赞135次，收藏489次。常见原因-1一般来说，出现NaN有以下几种情况：相信很多人都遇到过训练一个deep model的过程中，loss突然变成了NaN。在这里对这个问题做一个总结：1.如果在迭代的100轮以内，出现NaN，一般情况下的原因是因为你的学习率过高，需要降低学习率。可以不断降低学习率直至不出现NaN为止，一般来说低于现有学习率1-10倍即可。2.如果当前的网络是类似于RNN的循环神经网络的话，出现NaN可能是因为梯度爆炸的原因，一个有效的方式是增加“gradient clipping”（梯度截断来解决）_pytorch nanhttps://blog.csdn.net/ytusdc/article/details/122321907?fromshare=blogdetail&sharetype=blogdetail&sharerId=122321907&sharerefer=PC&sharesource=m0_61175448&sharefrom=from_link警惕！损失Loss为Nan或者超级大的原因警惕！损失Loss为Nan或者超级大的原因-腾讯云开发者社区-腾讯云训练或者预测过程中经常会遇到训练损失值或者验证损失值不正常、无穷大、或者直接nan的情况：https://cloud.tencent.com/developer/article/2346572?shareByChannel=link训练过程中Loss突然变为NaN的可能原因与解决

训练过程中Loss突然变为NaN的可能原因与解决_loss变成nan的原因-CSDN博客

在训模型的时候如果loss报Nan了，可能是因为什么？

在训模型的时候如果loss报Nan了，可能是因为什么？_模型训练出现为nan-CSDN博客

关于训练神经网路的诸多技巧Tricks(完全总结版)

关于训练神经网路的诸多技巧Tricks(完全总结版)-腾讯云开发者社区-腾讯云很多人都说训练神经网络和炼金术师炼药的过程相像，难以破解其中的黑盒子。其实不然，在训练的时候我们依然可以通过大量的技巧去最大化我们的训练效果，从而帮助我们的任务取得不错的精度，这些技巧是训练神经网络不可缺少的一环。https://cloud.tencent.com/developer/article/2346565?shareByChannel=link在显存足够的条件下，最好采用较大的batch-size进行训练，找到合适的学习率后，可以加快收敛速度。

fastai首席设计师Sylvain Gugger的一篇博客：How Do You Find A Good Learning Rate

Another data science student's blog – How Do You Find A Good Learning RateThis is the main hyper-parameter to set when we train a neural net, but how do you determine the best value? Here's a technique to quickly decide on one.https://sgugger.github.io/how-do-you-find-a-good-learning-rate.htmlWorse, a high learning rate could lead you to an increasing loss until it reaches nan.

PyTorch使用Tricks：梯度裁剪-防止梯度爆炸或梯度消失！！PyTorch使用Tricks：梯度裁剪-防止梯度爆炸或梯度消失！！_梯度裁剪值如何确定-CSDN博客文章浏览阅读7.5k次，点赞30次，收藏54次。本文介绍了如何在PyTorch中使用torch.nn.utils.clip_grad_norm_和torch.nn.utils.clip_grad_value_进行梯度裁剪，以防止梯度爆炸。文章详细讲解了这两种方法的使用示例，并讨论了梯度裁剪的适用场景、注意事项以及其对优化器性能的影响。https://blog.csdn.net/leonardotu/article/details/136145043?fromshare=blogdetail&sharetype=blogdetail&sharerId=136145043&sharerefer=PC&sharesource=m0_61175448&sharefrom=from_link

关注

14
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

崧小果 CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

149万+: 周排名

20万+: 总排名

3993: 访问

: 等级

176: 积分

55: 粉丝

68: 获赞

3: 评论

58: 收藏

私信

关注

热门文章

分类专栏

AI学习记录 5篇
科研小白成长路 2篇

最新评论

版本错误记录
CSDN-Ada助手: 恭喜用户发布了第7篇博客！持续创作真的不容易，版本错误记录这个主题也很有意思。建议下一步可以尝试探讨如何避免版本错误，或者分享一些解决版本错误的经验，让读者受益更多。希望您能继续保持创作的热情，加油！谢谢您的分享！
Latex学习记录
CSDN-Ada助手: 恭喜你写了第六篇博客！学习Latex确实是一项挑战，但你已经在这条路上取得了很大的进步。接下来，我建议你可以尝试写一些关于Latex实际运用的案例，或者分享一些自己的学习心得体会，这样可以让读者更加深入地了解Latex的知识点。加油，期待你的下一篇作品！
重装pytorch记录
CSDN-Ada助手: 恭喜你开始了博客创作，希望你能够坚持下去，分享更多关于pytorch的知识和经验。或许下一步可以尝试写一些关于pytorch的实际应用案例，或者分享一些解决问题的技巧和经验。期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。