为什么梯度是函数值上升最快的方向

最新推荐文章于 2022-07-23 10:05:02 发布

幻想乡的漏气威严

最新推荐文章于 2022-07-23 10:05:02 发布

阅读量1.1k

点赞数 3

分类专栏：数值最优化文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_44333151/article/details/117379715

版权

数值最优化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

导数
偏导数
方向导数
梯度

导数

在说梯度之前，我们先得到先知道导数->偏导->方向导数，然后才能了解梯度和为什么梯度方向是函数值上升最快的方向
对于导数，我们要明确，导数除了代表函数在某点的切线的斜率外，还表示函数在该点的变化率

$f(x_0)' = lim_{\Delta x\rightarrow 0}\frac{\Delta y}{\Delta x} = lim_{\Delta x\rightarrow 0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}$

即反应了函数值沿着x轴的方向变化率。

偏导数

拥有多个变量时的函数为多元函数，以二元函数 $z = f (x, y)$ 为例子

对于二元函数的偏导数：

$f_x(x,y)$ 指的是函数在y方向不变，函数值沿着x轴方向的变化率，即
$f_x(x_0,y_0)=lim_{\Delta x\rightarrow 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}$
$f_y(x,y)$ 指的是函数在x方向不变，函数值沿着y轴方向的变化率
$f_y(x_0,y_0)=lim_{\Delta x\rightarrow 0}\frac{f(x_0,y_0+\Delta y)-f(x_0,y_0)}{\Delta y}$
二元函数的图像是一个曲面，偏导数就是多元函数沿着某一个坐标轴的变化率，如果我们要考虑任意方向的变化率，是无法求解了，也无法了解整个函数的整体变化率，这就引出了方向导数

方向导数

方向导数就是沿着每个方向的函数值的变化率

以二元函数为例子：

单位向量的方向：

对于的坐标 $(x, y, z)$ ，设该向量和 $x, y, z$ 轴正方向的夹角为 $\alpha,\beta,\gamma$ ，则由 $x ， y ， z$ 轴的单位向量，则
$cos\alpha = \frac{(x,y,z)·(1,0,0)}{\sqrt{x^2+y^2+z^2}} = \frac{x}{\sqrt{x^2+y^2+z^2}}\\ cos\beta = \frac{(x,y,z)·(0,1,0)}{\sqrt{x^2+y^2+z^2}} = \frac{y}{\sqrt{x^2+y^2+z^2}}\\ cos\gamma = \frac{(x,y,z)·(0,0,1)}{\sqrt{x^2+y^2+z^2}} = \frac{z}{\sqrt{x^2+y^2+z^2}}\\ (cos\alpha,cos\beta,cos\gamma)=\frac{1}{\sqrt{x^2+y^2+z^2}}(x,y,z)$
所以 $(cos\alpha,cos\beta, cos\gamma)$ 是OP的同向的单位向量

所以对二元函数，单位向量为 $(cos\alpha, cos\beta)$

求参数方程：

设两点 $\vec{P}=(x,y), \vec{P_0}=(x_0,y_0)$

直线 $l=\vec{P_0P}=(x-x_0,y-y_0)$ 与向量 $e_l=(cos\alpha,cos\beta)$ 平行，且方向相同

所以
$\vec{P_0P} || e_l \rightarrow \vec{P_0P}=t\cdot e_l \\ \therefore (x-x_0, y-y_0)=t\cdot (cos\alpha, cos\beta)\\ \therefore x = x_0 + tcos\alpha, y = y_0 + tcos\beta \\ \therefore =P = (x,y) = (x_0 + tcos\alpha, y_0 + tcos\beta)$
所以沿着指向l的方向导数为 $\large\frac{\partial f}{\partial l}|_{(x_0,y_0)} = lim_{t\rightarrow 0}=\frac{f(x_0+tcos\alpha, y_0+tcos\beta)-f(x_0,y_0)}{t}$

即是函数在指向l的方向上的方向导数 $\frac{\partial f}{\partial l}|_{(x_0,y_0)}$

梯度

如果函数 $z = f (x, y)$ 可微分，那么函数沿着该点任意方向的方向导数必然存在

因为可微分，所以
$f(x_0+\Delta x, y_0+\Delta y)-f(x_0,y_0) \\ =f(x_0+\Delta x, y_0+\Delta y)-f(x_0+\Delta x, y_0) + f(x_0+\Delta x, y_0)-f(x_0,y_0)\\ =f_x(x_0,y_0)\Delta x + f_y(x_0,y_0)\Delta y + o(\sqrt{(\Delta x)^2 + (\Delta y)^2}) \\ 根据方向导数的定义，令\Delta x = tcos\alpha,\Delta y = tcos\beta\ 有\\ f_x(x_0,y_0)tcos\alpha + f_y(x_0,y_0)tcos\beta + o(\sqrt{(tcos\alpha)^2 + (tcos\beta)^2}) \\ = f_x(x_0,y_0)tcos\alpha + f_y(x_0,y_0)tcos\beta \\ \therefore \frac{\partial f}{\partial l}|_{(x_0,y_0)}=lim_{t\rightarrow 0}\frac{f_x(x_0,y_0)tcos\alpha + f_y(x_0,y_0)tcos\beta}{t} \\ = f_x(x_0,y_0)cos\alpha + f_y(x_0,y_0)cos\beta \\ = (f_x(x_0,y_0),f_y(x_0,y_0))\cdot (cos\alpha,cos\beta)$
令梯度为 $grad f = (f_x(x_0,y_0),f_y(x_0,y_0))$
其中 $(\cos \alpha,\cos \beta)$ 是方向
所以方向导数= $(f_x(x_0,y_0),f_y(x_0,y_0))\cdot (cos\alpha,cos\beta)=|f_x(x_0,y_0),f_y(x_0,y_0)|\cdot |cos\alpha,cos\beta|cos\alpha$ ，其中α是方向和梯度的夹角，所以当 $cos\alpha = 1即\alpha = 0$ 时取得最大，即方向和梯度同意方向时取得。

所以当方向为梯度的方向时，导数最大，则函数值上升最快。故反方向是下降最快

~~本文章写之前参考了很多文章，如果有些地方雷同，算我抄袭~~ ，其实当初只是为了搞清为什么梯度的反方向是函数值下降最快的方向，然后查了一堆资料，上面是我自己整理后，理清的结果罢了，如果觉得我的文章对你有帮助，那么请不要吝啬你的收藏和点赞（

幻想乡的漏气威严

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
为什么梯度是函数值上升最快的方向

文章目录导数偏导数方向导数梯度导数在说梯度之前，我们先得到先知道导数->偏导->方向导数，然后才能了解梯度和为什么梯度方向是函数值上升最快的方向对于导数，我们要明确，导数除了代表函数在某点的切线的斜率外，还表示函数在该点的变化率f(x0)′=limΔx→0ΔyΔx=limΔx→0f(x0+Δx)−f(x0)Δxf(x_0)' = lim_{\Delta x\rightarrow 0}\frac{\Delta y}{\Delta x} = lim_{\Delta x\rightarrow
复制链接

扫一扫