损失函数运行出nan和inf，原因是学习率过大引起的

最新推荐文章于 2025-04-06 20:23:26 发布

shitoucoming

最新推荐文章于 2025-04-06 20:23:26 发布

阅读量3.6k

点赞数 2

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shitoucoming/article/details/104763178

版权

深度学习专栏收录该内容

22 篇文章

订阅专栏

损失函数也是有可能导致输出nan，inf（由于梯度爆炸造成Loss爆炸引起）

原因很简单，学习率较高的情况下，直接影响到每次更新值的程度比较大，走的步伐因此也会大起来。过大的学习率会导致无法顺利地到达最低点，稍有不慎就会跳出可控制区域，此时我们将要面对的就是损失成倍增大(跨量级)。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。