基于梯度下降算法的参数更新公式的推导

最新推荐文章于 2024-07-21 17:05:22 发布

小笨鸟111

最新推荐文章于 2024-07-21 17:05:22 发布

阅读量1.6k

点赞数 4

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2668717514/article/details/94447702

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在前面一篇文章中写到了线性回归算法以及梯度下降算法对参数的更新：

$\theta_i=\theta_i^{'}-\alpha\frac{\partial Loss}{\partial \theta}$

每一个算法都会有相应的数学公式推导，那么这个参数更新公式是怎么来的呢？

首先看一张函数图片：

在这里插入图片描述

比如说我们的初始点在 $\theta_0$ 点，我们的下一步需要到达的点是 $\theta$ , 现在我们要做的就是根据已知的 $\theta_0$ 来得到下一步更新的 $\theta$ 点，就是我们的参数更新公式。

再看看，这张图是不是有些熟悉？对，就是我们高中刚学导数的时候推导的一个公式：

$\frac{f(\theta)-f(\theta_0)}{\theta-\theta_0}=\bigtriangledown f(\theta_0)$

当 $\theta$ 无限接近 $\theta_0$ 的时候，对应函数值的差值与 $\theta$ 与 $\theta_0$ 的差值的比值就是函数在 $\theta_0$ 点的梯度值，就是导数。

其实吧，这公式更严格地说来自泰勒展开式：

$f(x)=\sum_{i=0}^{n}\frac{f^{i}(x_0)}{i!}(x-x_0)^i$

当 $i$ =1时，就会得到上述公式，也就是泰勒一阶展开式。

那接下来就要对公式进行变换，将分子项移到右边

$f(\theta)-f(\theta_0)=(\theta-\theta_0)\bigtriangledown f(\theta_0)$

对每次更新 $\theta$ 值都希望使 $f(\theta)$ 值更小，所以可以得到

$f(\theta)-f(\theta_0)<0$

即 $(\theta-\theta_0)\bigtriangledown f(\theta_0)<0$ .

下面重点来了， $\theta-\theta_0$ 是一个很小的矢量，他的大小我们规定是我们每更新一个参数力度 $\eta$ （可以比作下山时每一步走的多少）,那么单位向量我们定义为 $v$ ,则上述公式可变为

$\eta v\bigtriangledown f(\theta_0)<0$

$\eta$ 是标量而且一般设定为正值，所以 $\eta$ 可以忽略，所以不等式变成

$v\bigtriangledown f(\theta_0)<0$

根据两个向量数量积公式可以得到

$|v||\bigtriangledown f(\theta)|cos(\beta)<0$

可知当 $cos(\beta)=-1$ 的时候 $v与\bigtriangledown f(\theta)$ 的方向完全相反即是梯度的负方向的时候，即使 $v\bigtriangledown f(\theta_0)$ 小于0且是局部最小值。因为 $v$ 是单位向量又是梯度的反方向，所以

$v=-\frac{\bigtriangledown f(\theta)}{|\bigtriangledown f(\theta)|}$

代如 $\theta-\theta_0=\eta v$ 中

$\theta=\theta_0-\eta \frac{\bigtriangledown f(\theta_0)}{|\bigtriangledown f(\theta_0)|}$

一般 $|\bigtriangledown f(\theta_0)|$ 是标量，可以并入到 $\eta$ 中简化为

$\theta=\theta_0-\eta\bigtriangledown f(\theta_0)$

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。