模型训练过程中loss出现nan的原因

最新推荐文章于 2024-06-25 10:34:32 发布

小伟db

最新推荐文章于 2024-06-25 10:34:32 发布

阅读量1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35985044/article/details/118990988

版权

本文探讨了在人工智能项目中遇到的问题，如数据质量问题、模型简化导致的拟合困难、不合理损失函数和参数初始化。重点讲解了如何通过数据预处理（归一化、BN等）、调整模型复杂度、优化学习率与训练技巧（如小样本过拟合、梯度裁剪）来提升模型性能。

摘要由CSDN通过智能技术生成

1，数据

1) 数据方面分为几个部分：数据本身的问题，（标注不合理，或者代码错误导致的问题，例如，分类，检测，分割中数据不正常的现象，或者进行数据增强的时候有些问题，（例如之前做检测的时候的问题。）、

使用归一化，归一化，减去均值，，使用BN，L2 norm，之前遇到过）

2，模型

1) 模型太简单，根本就无法进行拟合数据，这个时候，先对小样本进行训练，使他能够进行过拟合数据，保证模型本身没有问题，

2) 或者损失函数设计不合理，

3) 参数初始化的问题，更改初始化方法，对于CNN，一般用xavier或者msra的初始化方法

3，训练

1) 设置学习率，调整步长

2) 减小batch_szie.

3) 加入gradient clip

参考

https://www.zhihu.com/question/49346370

https://blog.csdn.net/qq_32458499/article/details/79468426

https://www.zhihu.com/question/424115619/answer/1512802303

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
模型训练过程中loss出现nan的原因

1，数据1)数据方面分为几个部分：数据本身的问题，（标注不合理，或者代码错误导致的问题，例如，分类，检测，分割中数据不正常的现象，或者进行数据增强的时候有些问题，（例如之前做检测的时候的问题。）、使用归一化，归一化，减去均值，，使用BN，L2 norm，之前遇到过）2，模型1)模型太简单，根本就无法进行拟合数据，这个时候，先对小样本进行训练，使他能够进行过拟合数据，保证模型本身没有问题，2)或者损失函数设计不合理，3)参数初始化的问题，更改初始化方法，对于CNN，一般...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。