梯度下降和牛顿算法

一.梯度下降

1.BGD

2.SGD

3.MBGD

概念学习:https://blog.csdn.net/u012421852/article/details/79562067

比较代码:https://blog.csdn.net/qq_26347025/article/details/79222967

二.牛顿算法

1.牛顿法

https://blog.csdn.net/sigai_csdn/article/details/80678812

2.拟牛顿法

有待学习!!!

三.区别

1.收敛速率

牛顿下降算法二阶收敛。没看明白。。下面链接有证明:

https://blog.csdn.net/robert_chen1988/article/details/53137997

2.梯度下降法是用平面去拟合当前的局部曲面,牛顿下降法是用二次曲面去拟合当前的局部曲面。

①.首先考虑一下这个公式,f\left ( x \right )是目标函数,用一阶泰勒展开式去拟合目标函数,其实就是用平面去拟合函数的局部曲面。 

f\left ( x+\Delta x \right )=f\left ( x \right )+\bigtriangledown f\left ( x \right )*\Delta x

我们的目的是使得左边的值变小,即f\left ( x+\Delta x \right )f\left ( x \right )小,那么应该使得\bigtriangledown f\left ( x \right )*\Delta x变为负值。 
但是如何使得上式一定为负值,简单的方法就是: 

\Delta x=-\bigtriangledown f\left ( x \right )
但是不要忘了以上所有的一切只有在局部成立,也就是说在小范围才成立,所以加个小的修正的因子,上式就变为: 

\Delta x=-\mu *\bigtriangledown f\left ( x \right )
最终得到公式: 

x_{n+1}=x_{n}-\mu *\bigtriangledown f\left ( x \right )
这就是为什么说梯度下降算法是用平面拟合函数的局部曲面。

②.牛顿下降法是用二次曲面去拟合当前的局部曲面

牛顿法的几何意义本质:在原函数的某一点处用一个二次函数近似原函数,然后用这个二次函数的极小值点作为原函数的下一个迭代点。


 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值