使用自定义loss时出现Nan和-inf问题

淘尽黄沙后

已于 2022-04-18 09:29:50 修改

阅读量2.2k

点赞数 1

分类专栏：问题与解决文章标签： python

于 2020-12-08 15:45:05 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/langtaosha1996/article/details/109378920

版权

在使用自定义损失函数时遇到训练过程中出现Nan和-inf的情况，主要原因是数据处理不当和数学运算错误。检查数据中是否存在Nan值，并确保在loss计算时避免除以0或开根号的数为0。通过修正数据预处理函数和添加防止除以0的保护，可以解决这个问题。在排查中发现，label中存在Nan值，修正相关函数后，问题得到缓解。

摘要由CSDN通过智能技术生成

主要检查两方面：

（1）数据处理过程中是否使input或者label中出现Nan值

        if len(np.unique(np.isnan(input))) > 1:
            print(name, np.unique(np.isnan(input)))

（2）自定义loss中存在除数为0或者开根号的数为0等情况，一般加一个极小数就可解决

使用自定义loss时，训练几代后就出现问题，loss计算中用了torch.sqrt()来开根号，在网络训练初期是没有什么问题的loss也都正常下降，但是训练到一半会出现NAN。

loss本身计算时不出现Nan，但是网络输出为Nan和-inf值

参考博客，初步认为是开根号中值为0的情况，修改代码：

e = 1e-6
torch.sqrt(a  + e)

改完后，仍然存在Nan的问题

进一步检查后，发现训练数据的label存在Nan值

最低0.47元/天解锁文章

淘尽黄沙后

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。