深度学习网络训练不收敛问题

不收敛描述及可能原因分析

不收敛情景1

  • 描述
    从训练开始就一直震荡或者发散
  • 可能原因
    • 图片质量极差,人眼几乎无法识别其中想要识别的特征,对于网络来说相当于输入的一直都是噪音数据,比如通过resize的时候,图片的长宽比改变特别大,使图片丧失对应特征;或者tfrecord中图片大小是(m,n),但是读取的时候,按照(n,m)读取。所以loss一直震荡无法收敛
    • 大部分标签都是对应错误的标签
    • leaning rate 设置过大

不收敛情景2

  • 描述
    训练开始会有所下降,然后出现发散
  • 可能原因
    • 数据标签中有错误,甚至所有标签都有一定的错误,比如生成的标签文件格式和读取标签时设置的文件格式不一样,导致读取的标签是乱码;或者为标签中存在的空格未分配对应的编码,导致读取的空格为乱码(在OCR问题中)
    • learning rate 设置过大

不收敛情景3

  • 描述
    训练开始会有所下降,然后出现震荡
  • 可能原因
    • loss函数中正则化系数设置有问题,或者loss函数本身有问题。比如,在序列化问题中的label_smoothing设置过大,比如设置为0.9,一般设置为0.1即可(OCR问题中)
    • 数据标签中有错误,甚至所有标签都有一定的错误

不收敛场景4

  • 描述
    训练开始会有一点点,然后无法收敛,生成结果几乎一致,全局像素一样
  • 可能原因
    -参数初始化问题,比如网络中有bn的时候,如果把std初始化为0,会导致没有梯度回传。
  • 9
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值