牛顿法总结

最新推荐文章于 2023-05-23 19:32:56 发布

孤鸿子_

最新推荐文章于 2023-05-23 19:32:56 发布

阅读量401

点赞数

分类专栏：机器学习文章标签：牛顿法优化梯度下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dylan_Frank/article/details/86567651

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

这里总结一个利用二价导数来求最优解的方法-牛顿法:

设: $f (X)$ 是一个多维函数,由taylor 二阶展开，我们有,

$\approx f(X_0)+(X-X_0)\nabla f(X_0) + \frac{(X-X_0)\nabla^2 f(X_0)(X-X_0)}{2}$

对 $X$ 求导，并设置为0，我们有

$\begin{aligned} 0&=\nabla f(X_0) + (X-X_0) \nabla ^2 f(X_0) (X- X_0)\\ X&=-\frac{\nabla f(X_0)}{\nabla^2 f(X_0)} X_0 \end{aligned}$

相当于将梯度下降的learning rate设置为 $(\nabla^2 f(X_0))^{-1}$

note

显然牛顿法计算量更大，因为他需要计算 hessian矩阵，相对于梯度下降来说这是 $n^2$ 的
牛顿法收敛率更快 $O(t^{-2})$ ,梯度下降是 $O(t^{-1})$

版权声明

本作品为作者原创文章，采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议

作者: taotao
原始link: https://zouzhitao.github.io/posts/newton-method/
转载请保留此版权声明，并注明出处

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。