训练过程中出现loss为nan的问题

weiweiweimengting

已于 2022-07-14 12:17:27 修改

阅读量491

点赞数 1

文章标签：深度学习神经网络 pytorch

于 2022-07-14 11:13:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47062807/article/details/125780316

版权

问题描述

这是一场由学习率引发的血案

在训练时，第一个batch打印出来的loss还很正常，但是后面逐渐增大的不可控制，直接显示为nan值，之前设计对比学习损失函数的时候也出现过类似的情况，当时的问题出在抽取的特征向量没有归一化，导致两向量的乘积过大。但是这次我真的无解了。。
就在我回头检查训练参数的时候，我发现优化器中的学习率调用的是超参中的args.num_classes=5，也就是说，我把学习率默认设置成了5🥴

综上，学习率过大也可能会导致loss出现无穷大的情况。
完结撒花🎇🎇🎇

weiweiweimengting

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
训练过程中出现loss为nan的问题

在训练时，第一个batch打印出来的loss还很正常，但是后面逐渐增大的不可控制，直接显示为nan值，之前设计对比学习损失函数的时候也出现过类似的情况，当时的问题出在抽取的特征向量没有归一化，导致两向量的乘积过大。但是这次的情况不一样，这次是因为网络设计中有除的情况，产生了数值不稳定，如下：解决我没有仔细打印.div后面的每项数，但是粗略的看了一下结果中有大量的零值，所以推测可能是由于除数出现零值导致的无穷大，在后面加上一项微小常数后就可以正常收敛了。......
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。