每日一问02——在训练过程中,若一个模型不收敛,是否说明这个模型无效?导致模型不收敛的原因有哪些?

每日一问02

Question:在训练过程中,若一个模型不收敛,是否说明这个模型无效?导致模型不收敛的原因有哪些?


在训练过程中,如果模型不收敛并不能说明该模型时无效的。

导致模型不收敛的原因包括:

1. 没有对数据做归一化处理。

2. 没有使用正则化。

3.Batch Size设的太大

4.学习率设置的太大容易产生震荡,太小会导致不收敛。

5.没有做数据预处理。

6.没有检查过预处理结果和最终的训练测试结果。

7.网络存在坏梯度,比如当Relu对负值的梯度为0,反向传播时,梯度为0表示不传播。

8.网络设定不合理,网络太浅或者太深。

9.最后一层的激活函数错误。

10.参数初始化错误。

11.隐藏层神经元数量错误。

12.数据集标签的设置有错误。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值