模型训练过程中loss出现nan的原因

本文探讨了在人工智能项目中遇到的问题,如数据质量问题、模型简化导致的拟合困难、不合理损失函数和参数初始化。重点讲解了如何通过数据预处理(归一化、BN等)、调整模型复杂度、优化学习率与训练技巧(如小样本过拟合、梯度裁剪)来提升模型性能。
摘要由CSDN通过智能技术生成

1,数据

1) 数据方面分为几个部分:数据本身的问题,(标注不合理,或者代码错误导致的问题,例如,分类,检测 ,分割中数据不正常的现象,或者进行数据增强的时候有些问题,(例如之前做检测的时候的问题。)、

使用归一化 ,归一化,减去均值,,使用BN,L2 norm,之前遇到过)

2,模型

1) 模型太简单,根本就无法进行拟合数据,这个时候,先对小样本进行训练,使他能够进行过拟合数据 ,保证模型本身没有问题 ,

2) 或者损失函数设计不合理,

3) 参数初始化的问题,更改初始化方法,对于CNN,一般用xavier或者msra的初始化方法

3,训练

1) 设置学习率,调整步长

2) 减小batch_szie.

3) 加入gradient clip

参考 

https://www.zhihu.com/question/49346370

https://blog.csdn.net/qq_32458499/article/details/79468426

https://www.zhihu.com/question/424115619/answer/1512802303

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值