数值优化 - 牛顿法

NG的课件1也讲到了牛顿法,它对应的update rule是

   

   

   

   

   

H对应Hessian矩阵

http://en.wikipedia.org/wiki/Hessian_matrix

   

http://aria42.com/blog/2014/12/understanding-lbfgs/

给出了关于牛顿法更详细的解释:

   

将函数做泰勒展开 http://en.wikipedia.org/wiki/Taylor_series

对比单变量函数泰勒展开公式:

   

   

考虑我们需要找一阶导数是0的位置

   

和ng课件给出的一致。

   

牛顿法和梯度下降相比收敛更加快速,但是每次迭代的计算量更大(n+1,n+1)维度的hessian矩阵的计算,但是如果n不是特别大那么整体来看牛顿法更快。

   

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值