【深度学习-LOSS】loss曲线的各种情况对应解决办法

最新推荐文章于 2025-03-12 15:57:01 发布

凡天宁

最新推荐文章于 2025-03-12 15:57:01 发布

阅读量7k

点赞数 9

文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/fantianning/article/details/115880363

版权

本文解析了训练过程中loss的各种变化情况及背后的原因，包括下降、不变、波动等，并针对每种情况提出了有效的解决办法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

“loss的各种情况”

【基础情况】

train loss	test loss	情况	解决办法
下降	下降	网络仍在学习（😄）	增加EPOCH直到不再下降
下降	下降	网络过拟合（😦）	减小层中units数 / 减小层数 / 简化网络结构
不变	下降	数据集有问题（😡）	检查数据集
不变	不变	学习遇到瓶颈（😦）	减小学习率 / 减小BATCH SIZE

【补充情况】

train loss	test loss	情况	解决办法
下降	波动下降	学习率过大或 BATCHSIZE过大	如果收敛，可以不管 / 如果不收敛，减小学习率或BATCHSIZE
收敛到较大值	收敛到较大值	可能是陷入了局部极小值	换一种带动量的optimizer试试