关于梯度下降的理解

    这段时间,特别懵懵懂懂,每天跑网络但是不知道为什么这样做,总感觉是个黑盒子,想要慢慢把它原理弄清楚。

1、为什么梯度下降可以达到全局最优点?为什么朝着梯度的反方向下降是正确的方向?

    拿一个回归函数以及目标函数为例:

以均方误差作为目标函数(损失函数)

我们的目的是将损失函数的损失降到最低,这意味着我们的回归精度得到了提高。由拉格朗日中值定理

我们可以得到要使f(x0+\bigtriangleup x)比f(x0)要小,我们就要使得f{}'(x0)\bigtriangleup x为负值并且越大越好。随即,我们对损失函数进行求导:

参数沿着导数的方向移动,

ak为学习率,pk为方向向量,f{}'(x0)是梯度,沿着梯度的反方向下降是收敛最快的方向,因此沿着梯度的反方向下降会使得损失值变小,使得精度提高。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值