神经网络训练不起来怎么办?(一)局部最小值(Local minima)与鞍点(saddle point)

critical point指的是鞍点(saddle point)和局部最优点(local minima),当训练不起来时候可能是此时梯度(gradient)为0训练不起来了,此时可能遇到了critical point。

那么如何判断遇到的是saddle point还是local minima呢?

根据上面的这个公式,计算(H)Hessian的值,当他为正时为则为local minima 当它为负值时为local minima,当它时为正,时而为负时,那么它就是saddle point.

 

例子如下图所示,利用了最简单的y=w1w2x来计算,取x=1,y=1,当gradient为0,w1=w2=0,求它的二次微分得到H为一个2×2的矩阵,求它的特征值(eigen vetor)\lambda 1=2\lambda 2=-2可知它为一个saddle point。

当确定为saddle point 时,那么当\lambda <0 时,那么沿着特征向量(eigen value)u 方向去更新参数,就会使得你的loss值变小。但是由于H是一个矩阵,所以当参数多的时候很难算出来,一般都不用这个方法来解决saddle point 的问题。

对local minima 和 saddle point 来说,由于一般神经网络计算的维度(dimension)都比较很高,那么梯度下降的算法(下山的路径)就很多了,所以saddle point是比较常见的。

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值