有关神经网络模型训练过程中loss值始终变化不大的问题

原创已于 2022-03-02 16:26:01 修改

· 1w 阅读

·

6

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #神经网络

于 2022-03-02 16:22:42 首次发布

博主在训练一个6分类的神经网络模型时遇到loss值恒定不变，导致模型学习效果不佳。尝试了增加训练轮次、调整学习率和改变batch_size等方法无效。最终，通过改变模型权重初始化方式，成功使loss值下降，模型训练恢复正常，准确度提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在训练一个神经网络模型，遇到了loss值始终不变的问题。

简要说一下，我训练的是一个分类器，是一个最后分类数为6的多元分类问题，但模型在训练多个轮次后准确度仍然在16.67%左右，loss值基本没有怎么变化，也就是说，我的模型参数并没有怎么变化，相当于没有在学习。

在网上查了各种资料后，我尝试了以下几种方法：

1.加大训练轮次

起初，我以为是我的模型训练轮次太少，但发现加大训练轮次后并没有效果，该方法对我的模型不适用

2.增大学习率

最开始我的模型优化器为Adam，学习率设置为1e-3，我认为可能时学习率太小，导致学习太慢（这个方法的思路和加大训练轮次差不多），但发现将学习率改为0.01或者0.1后会出现loss值过大为nan的问题，该方法也不行

3.调整batch_size

我尝试着增大或减小batch_size，发现模型的loss并没有什么改善

最后，在像无头苍蝇一样地尝试了各种方法之后，我看到了

如何解决神经网络训练时loss不下降的问题 | AI柠檬 (ailemon.net)https://blog.ailemon.net/2019/02/26/solution-to-loss-doesnt-drop-in-nn-train/这篇文章，受到了启发，尝试改变了模型权重参数初始化的方法，于是，模型训练时loss值开始较大幅度的下降，分类准确度也逐渐上升，模型训练终于正常了。

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

代码的女朋友 你的鼓励是我继续创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。