训练过程loss突然增大可能的原因

最新推荐文章于 2024-11-28 10:48:29 发布

半山腰等风的猪

最新推荐文章于 2024-11-28 10:48:29 发布

阅读量3.5w

点赞数 21

分类专栏：个人成长文章标签：深度学习机器学习人工智能 python 神经网络

原文链接：https://discuss.gluon.ai/t/topic/7174/5

版权

个人成长专栏收录该内容

15 篇文章

订阅专栏

                    
                        
                    
                    训练样本是否 shuffle 过，如果没shuffle 可能你之前都拟合一些近似的样本 误差很小，然后在一个 batch
 中突然拟合了一个和之前差异很大的样本
如果使用了 adam，通常对这种情况会处理的好一点，adam的两个 ema参数可以调整试试，可以快进你的
 迭代速度，把他们调大一些，快进的速度为 1/(1-lambda)。
使用adam 了解了数据集的迭代特性后建议切换回到 SGD，通过进一步参数调整来得到更好的结果。
learning rate 如果刚开始过大的话，数值容易出现不稳定的情况，可以尝试调小
还要看一下你的 network 是哪一种类型，通常 RNN 类的经常更容易遇到这样的问题，尝试简化模型。
如果尝试很多方法都不行，那么可能是数据集的特征和 label 不match
 【转】