梯度下降

本文以单变量的线性回归 f ( x ) = w x f(x)=wx f(x)=wx模型来讲解梯度下降。

1.线性回归模型

线性回归模型的表达式为:
f ( x ) = w x f(x)=wx f(x)=wx
线性回归模型的损失函数为:
l o s s = 1 2 m ∑ i m f ( x i ) − y i loss=\frac{1}{2m}\sum_i^m{f(x_i)-y_i} loss=2m1imf(xi)yi
其中为 m m m样本数量, x x x为样本特征 x i x_i xi为第 i i i个样本 f ( x i ) f(x_i) f(xi)为第 i i i个样本的预测值, y i y_i yi为第 i i i个样本标签。

线性回归的目标是是求得:
min ⁡ ( l o s s ) = min ⁡ 1 2 m ∑ i m f ( x i ) − y i \min (loss) =\min{\frac{1}{2m}\sum_i^m{f(x_i)-y_i}} min(loss)=min2m1imf(xi)yi

2.梯度下降

梯度下降更新 w w w的策略为:
w = w − α d ( l o s s ) d w = w − α d ( 1 2 m ∑ i m f ( x i ) − y i ) d w = w − α d ( 1 2 m ∑ i m w x i − y i ) d w = w − α 1 m ∑ i m ( w x i − y i ) x i \begin{aligned} w&=w-\alpha\frac{d (loss)}{dw}\\ &=w-\alpha\frac{d {(\frac{1}{2m}\sum_i^m{f(x_i)-y_i)}}}{dw}\\ &=w-\alpha\frac{d {(\frac{1}{2m}\sum_i^m{wx_i-y_i)}}}{dw}\\ &=w-\alpha\frac{1}{m}\sum_i^m(wx_i-y_i)x_i \end{aligned} w=wαdwd(loss)=wαdwd(2m1imf(xi)yi)=wαdwd(2m1imwxiyi)=wαm1im(wxiyi)xi

为了加快训练速度每轮可以不用全量样本m个,而改用一个较小的值batch,每次迭代从m个样本中选取batch个样本带入公式。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值