【算法】深度学习模型损失值loss不收敛,曲线震荡发散怎么办?

在这里插入图片描述
理想的深度学习模型,其损失曲线应该是逐渐下降,最终收敛的。

但是,有的时候loss偏偏不收敛,可能代码啥都没改,就换了个预训练模型,然后模型就崩了,你说气不气?

可能的解决方法——加大 batch_size

简而言之,在数据集类别不均衡的时候,如果batch_size很小,那么可能这一批样本都是同一个类别,导致后续模型判别有失偏颇。增大batch_size后,就会一定程度上缓解这个问题。

今天 batch_size 依次设置为 24,36 和 64,见证 loss 从发散、震荡再到收敛。

另外借鉴大佬的回答:
在这里插入图片描述
参考资料:
[1] https://www.zhihu.com/question/32673260/answer/71137399#showWechatShareTip

猜你喜欢:👇🏻
【算法】SVM分类精度为0,结果很烂怎么办?
【算法】深度学习神经网络都调哪些参数?
【算法】梯度消失与梯度爆炸

在这里插入图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值