梯度下降算法推导

为什么梯度的反方向为下降速度最快的方向?

x , y 都表示 权重,f 表示损失函数。

1.可由近似公式得到:

f ( x + Δ x , y + Δ y ) = f ( x , y ) + ∂ f ∂ x ⋅ Δ x + ∂ f ∂ y ⋅ Δ y f(x+ \Delta x,y+\Delta y)=f(x,y)+\frac{\partial f}{\partial x} \cdot \Delta x+\frac{\partial f}{\partial y} \cdot\Delta y f(x+Δx,y+Δy)=f(x,y)+xfΔx+yfΔy

2.即:

f ( x + Δ x , y + Δ y ) − f ( x , y ) = ∂ f ∂ x ⋅ Δ x + ∂ f ∂ y ⋅ Δ y f(x+\Delta x,y+\Delta y)-f(x,y)=\frac{\partial f}{\partial x} \cdot \Delta x+\frac{\partial f}{\partial y} \cdot\Delta y f(x+Δx,y+Δy)f(x,y)=xfΔx+yfΔy

3.

Δ z = ∂ f ∂ x ⋅ Δ x + ∂ f ∂ y ⋅ Δ y \Delta z=\frac{\partial f}{\partial x} \cdot \Delta x+\frac{\partial f}{\partial y} \cdot\Delta y Δz=xfΔx+yfΔy

因为 Δ z \Delta z Δz 表示变化量 ,最大值表示 变化最大 (增加最大),即增加最快的方向。

最小值表示下降最大,即下降最快的方向。 等式右边可写作向量的形式。

4.

( ∂ f ∂ x , ∂ f ∂ y ) ⋅ ( Δ x , Δ y ) (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y})\cdot(\Delta x,\Delta y) (xfyf)(Δx,Δy)
左边表示 梯度,所以梯度的反方向 乘积最小,二者夹角-180度, 即下降最快。

5.

所以:
( Δ x , Δ y ) = − a ( ∂ f ∂ x , ∂ f ∂ y ) (\Delta x,\Delta y) = - a(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}) (Δx,Δy)=a(xfyf)

所以:
x + Δ x = x − a ⋅ ∂ f ∂ x x+\Delta x = x-a\cdot\frac{\partial f}{\partial x} x+Δx=xaxf
y + Δ y = y − a ⋅ ∂ f ∂ y y+\Delta y = y-a\cdot\frac{\partial f}{\partial y} y+Δy=yayf

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PsgQ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值