为什么梯度反方向是函数值局部下降最快的方向?

0. 梯度与导数

梯度:矢量,方向指向数值增长最快的方向,大小为变化率。

导数:常量,两者应该有本质的区别,而导数的正负也反映了函数值的大小变化,而不是一直指向数值增大的方向。

其实一元函数肯定也有梯度,我们经常不提及的原因其实很简单:一元函数的梯度方向沿着x方向!而导数值的正负号决定了这个方向是正方向还是反方向。如图所示,A点右"领域"的导数为正值,则梯度的方向跟x轴正方向一致,梯度方向指向数值增大的方向;相反在B点右"领域",导数为负值,则梯度的方向为x轴的负方向,梯度方向也是指向数值增大的方向。通过这个例子向多维函数推广,梯度从数值小指向数值大的物理意义也就容易理解了。而一元函数的梯度大小自然也就是导数的绝对值。类似的,二元函数,其梯度方向为xy平面内,注意,梯度方向只能在自变量空间内取值。

1. 导数

 当函数定义域和取值都在实数域中的时候,导数可以表示函数曲线上的切线斜率。 除了切线的斜率,导数还表示函数在该点的变化率。

将上面的公式转化为下面图像为:

直白的来说,导数代表了在自变量变化趋于无穷小的时候,函数值的变化与自变量变化的比值代表了导数,几何意义有该点的切线。物理意义有该时刻的(瞬时)变化率.。

注意在一元函数中,只有一个自变量变动,也就是说只存在一个方向的变化率,这也就是为什么一元函数没有偏导数的原因。

 2.偏导数

谈到偏导数,那就至少涉及到两个自变量,以两个自变量为例,z=f(x,y) . 从导数到偏导数,也就是从曲线来到了曲面. 曲线上的一点,其切线只有一条。但是曲面的一点,切线有无数条。

而我们所说的偏导数就是指的是多元函数沿坐标轴的变化率.

[公式]指的是函数在y方向不变,函数值沿着x轴方向的变化率

[公式]指的是函数在x方向不变,函数值沿着y轴方向的变化率

对应的图像形象表达如下:

那么偏导数对应的几何意义是是什么呢?

  • 偏导数[公式]就是曲面被平面[公式]所截得的曲面在点[公式]处的切线[公式]对x轴的斜率
  • 偏导数[公式]就是曲面被平面[公式]所截得的曲面在点[公式]处的切线[公式]对y轴的斜率

可能到这里,读者就已经发现偏导数的局限性了,原来我们学到的偏导数指的是多元函数沿坐标轴的变化率,但是我们往往很多时候要考虑多元函数沿任意方向的变化率,那么就引出了方向导数.

3. 方向导数

假设山坡表示为[公式],你应该已经会做主要俩个方向的斜率。y方向的斜率可以对y偏微分得到,同样的,x方向的斜率也可以对x偏微分得到。

那么我们可以使用这俩个偏微分来求出任何方向的斜率(类似于一个平面的所有向量可以用俩个基向量来表示一样)

[公式]

那么一个平面上无数个方向,函数沿哪个方向变化率最大呢?

目前我不管梯度的事,我先把表达式写出来:

[公式]

[公式],[公式]

那么我们可以得到:

[公式]([公式]为向量[公式]与向量[公式]之间的夹角)

那么此时如果[公式]要取得最大值,也就是当[公式]为0度的时候,也就是向量[公式](这个方向是一直在变,在寻找一个函数变化最快的方向)与向量[公式](这个方向当点固定下来的时候,它就是固定的)平行的时候,方向导数最大.方向导数最大,也就是单位步伐,函数值朝这个反向变化最快.

好了,现在我们已经找到函数值下降最快的方向了,这个方向就是和[公式]向量相同的方向.那么此时我把A向量命名为梯度(当一个点确定后,梯度方向是确定的),也就是说明了为什么梯度方向是函数变化率最大的方向了!!!(因为本来就是把这个函数变化最大的方向命名为梯度)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值