模型训练过程中出现Nan该怎么办？

upDiff

已于 2022-05-08 10:15:06 修改

阅读量4k

点赞数

文章标签：深度学习 python 机器学习人工智能计算机视觉

于 2022-05-04 11:01:13 首次发布

未经授权，禁止转载，如需转载请私信

本文链接：https://blog.csdn.net/dlhlSC/article/details/124393071

版权

零基础入门机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

导

语

在深度学习模型训练过程中，有时会出现损失值为Nan的情况。那么在训练过程中发生Nan的最常见原因是什么？其次，有什么方法可以解决这个问题？

1-无效输入

原因：输入中包含Nan或者输入为空，对于图像而言输入为损坏的图片。

检查方法：使用python的异常检测机制对数据进行合格检测

解决方法：修改代码满足输入为有效的数据，比如在检查过程中先删除受损的图片。

2-损失函数

原因：有时损耗函数的计算会导致Nan的出现。例如给InfogainLoss层提供非归一化的值或者使用有bug的自定义损失层等。

检查方法：了解损失函数对数据输入的格式及数据范围要求，仔细检查代码实现。

解决方法：修改损失函数的代码bug

3-梯度爆炸

原因：梯度爆炸会使模型发散，因此损失值出现Nan。

检查方法：查看程序运行日志，查找每次模型迭代时打印的损失值。一般在出现Nan前，损失值在某次迭代后开始显着增长，最终损失将太大而无法用浮点变量表示，它将变为Nan。

解决方法：将初始学习率比之前减少一个数量级或者更多。如果模型有多个损失项，则应检查日志以了解哪项导致梯度爆炸，然后减少该特定项的损失权重（loss_weight）。

END

关注公众号：实用AI客栈
获取最新AI资讯与实战案例
小编微信号 : langu86

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
模型训练过程中出现Nan该怎么办？

导语在深度学习模型训练过程中，有时会出现损失值为Nan的情况。那么在训练过程中发生Nan的最常见原因是什么？其次，有什么方法可以解决这个问题？01无效输入原因：输入中包含Nan或者输入为空，对于图像而言输入为损坏的图片。 检查方法：使用python的异常检测机制对数据进行合格检测解决方法：修改代码满足输入为有效的数据，比如在检查过程中先删除受损的图片。02损失函数原因：有时损耗函数的计算会导致Nan的出现。例如给InfogainLoss层提供非归一化的值或者使用有bug的自定义损失层等。检查方法：
复制链接

扫一扫

专栏目录

upDiff CSDN认证博客专家 CSDN认证企业博客

码龄12年

333: 原创

2万+: 周排名

1万+: 总排名

90万+: 访问

: 等级

9968: 积分

1756: 粉丝

369: 获赞

144: 评论

774: 收藏

私信

关注

热门文章

分类专栏

最新评论

CVPR2023新作：3D人体姿态估计
m0_72561656: 您好，我想问一下为什么质心com和压力中心cop重叠就能证明这个pose是stability
CVPR2023新作：在点云中无监督地学习人体关键点
alubabaobao: 请问有github链接吗
CVPR2023新作：夜间物体检测
高数辅导第四版: 请问论文里的AP指的是测试结果里IOU等于多少的AP [code=python] Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.198 Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.401 Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.175 Average Precision (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.085 Average Precision (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.233 Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.346 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.173 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.286 Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.300 Average Recall (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.183 Average Recall (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.341 Average Recall (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] [/code]
VoteHMR训练代码跑通流程整理
奥特manhahhah: 有跑通的友友吗？
CVPR2022场景文字识别新作SwinTextSpotter
fc_man: 一起交流，QQ1462174007

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

upDiff 你的鼓励将是我创作的最大动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。