神经网络调参：loss震荡过于明显/loss剧烈抖动

最新推荐文章于 2025-03-14 09:26:05 发布

全员鳄鱼

最新推荐文章于 2025-03-14 09:26:05 发布

阅读量5.8w

点赞数 36

分类专栏： python PyTorch 知识分享文章标签：深度学习人工智能 pytorch tensorflow 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38372240/article/details/108784005

版权

在训练神经网络时，loss的剧烈震荡可能是多种问题的表现。无过拟合时，应考虑loss函数的选择、batch size的适宜性、激活函数的影响以及学习率的调整。过拟合时，可通过提前终止训练找到最优模型，应用正则化、调整网络结构或增加训练数据量来缓解。适当的优化器选择也是关键。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

在训练网络的时候，常常会出现loss出现非常明显的剧烈抖动情况，虽然大多数情况可以继续训练下去，但是实际上还是预示着问题存在。而且，有不同维度的问题，这也需要不同的解决方法，但是具体究竟是哪一种，还得具体情况具体分析。

无过拟合

是否找到合适的loss函数：在深度学习里面，不同的loss针对的任务是有不同的，有些loss函数比较通用例如L1/L2等，而如perceptual loss则比较适合在图像恢复/生成领域的任务上。当loss出现问题的适合，想一想，是不是loss设置的有问题，别人在此领域的任务的方法是否也使用和你一样的loss。
batch size是否合适：batch size的问题一般是较大会有比较好的效果，一是更快收敛，二是可以躲过一些局部最优点。但是也不是一味地增加batch size就好，太大的batch size 容易陷入sharp minima，泛化性不好。较小的batch size可能会使得网络有明显的震荡。
是否使用合适的激活函数：一般来说，都几乎使用RELU作为全局激活函数，尽可能少的使用sigmoid激活函数（激活范围太小），容易造成梯度弥散、消失
学习率：学习率太大，一步前进的路程太长，会出现来回震荡的情况，但是学习率太小，收敛速度会比较慢。
是否选择合适的优化算法：一般来说，我都使用Adam作为优化器（默认参数&#

最低0.47元/天解锁文章

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。