要说清楚这个问题,就要明白什么是函数值上升的速率,实际也就是方向导数。为弄清楚方向导数的含义,先来回顾 一元函数导数定义:
导数
f
′
(
x
0
)
=
lim
x
→
x
0
f
(
x
)
−
f
(
x
0
)
x
−
x
0
f'(x_0)=\lim\limits_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0}
f′(x0)=x→x0limx−x0f(x)−f(x0)。
这里
x
x
x可以大于
x
0
x_0
x0,也可以小于
x
0
x_0
x0。导数的含义就是因变量随着自变量的变化而变化的快慢,或者因变量相应于自变量的变化率。具体意义就是: 如果导数
f
′
(
x
0
)
>
0
f'(x_0)>0
f′(x0)>0,说明,因变量随着自变量的增大
(
x
>
x
0
)
(x>x_0)
(x>x0)而增大,或者因变量随着自变量的减小(
x
<
x
0
x<x_0
x<x0)而减小。如果导数
f
′
(
x
0
)
>
0
f'(x_0)>0
f′(x0)>0,说明,因变量随着自变量的增大
(
x
>
x
0
)
(x>x_0)
(x>x0)而减小,或者因变量随着自变量的减小(
x
<
x
0
x<x_0
x<x0)而增大。
方向导数
顾名思义,和方向有关的导数,实际含义是一个多元函数
f
f
f,在某一点的某一方向的导数。
在多元函数中,要考察函数值的变化趋势,因为自变量是高维空间(维度大于1)。因此需要考察函数值在某一点的某一方向的变化快慢。因此也可以看出,方向导数是个标量。(因为函数值也随着向量长度的变化而变化,我们不考虑向量长度带来的变化,因此该方向约束为单位向量:
P
Q
→
=
(
c
o
s
α
,
c
o
s
β
)
\overrightarrow{PQ}=(cos\alpha,cos\beta)
PQ=(cosα,cosβ)单位向量。)
多元函数
f
f
f,在某一点
P
(
x
0
,
y
0
)
P(x_0,y_0)
P(x0,y0)的某一方向
P
Q
→
\overrightarrow{PQ}
PQ的导数定义。Q:(x,y)
φ
f
φ
P
Q
→
∣
(
x
0
,
y
0
)
=
lim
P
Q
→
→
(
0
,
0
)
f
(
x
,
y
)
−
f
(
x
0
,
y
0
)
∣
P
Q
→
∣
\frac{\varphi f}{\varphi \overrightarrow{PQ}}|_{(x_0,y_0)} \\=\lim\limits_{\overrightarrow{PQ}\rightarrow(0,0)}\frac{f(x,y)-f(x_0,y_0)}{|\overrightarrow{PQ}|}
φPQφf∣(x0,y0)=PQ→(0,0)lim∣PQ∣f(x,y)−f(x0,y0)
如何计算方向导数呢?借助泰勒展开式得。
=
lim
P
Q
→
→
(
0
,
0
)
f
x
(
x
0
,
y
0
)
(
x
−
x
0
)
+
f
y
(
x
0
,
y
0
)
(
y
−
y
0
)
+
o
(
(
x
−
x
0
)
2
+
(
y
−
y
0
)
2
)
∣
P
Q
→
∣
=
lim
P
Q
→
→
(
0
,
0
)
f
x
(
x
0
,
y
0
)
(
x
−
x
0
)
∣
P
Q
→
∣
+
f
y
(
x
0
,
y
0
)
(
y
−
y
0
)
P
Q
→
=
lim
P
Q
→
→
(
0
,
0
)
f
x
(
x
0
,
y
0
)
c
o
s
α
+
f
y
(
x
0
,
y
0
)
c
o
s
β
=\lim\limits_{\overrightarrow{PQ}\rightarrow(0,0)}\frac{f_x(x_0,y_0)(x-x_0)+f_y(x_0,y_0)(y-y_0)+o(\sqrt{(x-x_0)^2+(y-y_0)^2})}{|\overrightarrow{PQ}|} \\=\lim\limits_{\overrightarrow{PQ}\rightarrow(0,0)}f_x(x_0,y_0)\frac{(x-x_0)}{|\overrightarrow{PQ}|}+f_y(x_0,y_0)\frac{(y-y_0)}{\overrightarrow{PQ}} \\=\lim\limits_{\overrightarrow{PQ}\rightarrow(0,0)}f_x(x_0,y_0)cos\alpha+f_y(x_0,y_0)cos\beta
=PQ→(0,0)lim∣PQ∣fx(x0,y0)(x−x0)+fy(x0,y0)(y−y0)+o((x−x0)2+(y−y0)2)=PQ→(0,0)limfx(x0,y0)∣PQ∣(x−x0)+fy(x0,y0)PQ(y−y0)=PQ→(0,0)limfx(x0,y0)cosα+fy(x0,y0)cosβ
其中
α
\alpha
α为
P
Q
→
\overrightarrow{PQ}
PQ与
x
x
x轴正方向的夹角,
β
\beta
β为
P
Q
→
\overrightarrow{PQ}
PQ与
y
y
y轴正方向的夹角。
0
≤
α
≤
π
,
0
≤
β
≤
π
0\leq\alpha\leq\pi,0\leq\beta\leq\pi
0≤α≤π,0≤β≤π。由方向角或者方向余弦概念可知
c
o
s
α
2
+
c
o
s
β
2
=
1
cos\alpha^2+cos\beta^2=1
cosα2+cosβ2=1。
梯度
定义grad
f
(
x
0
,
y
0
)
f(x_0,y_0)
f(x0,y0)或
∇
f
(
x
0
,
y
0
)
=
(
f
x
(
x
0
,
y
0
)
,
f
y
(
x
0
,
y
0
)
)
\nabla f(x_0,y_0)=(f_x(x_0,y_0),f_y(x_0,y_0))
∇f(x0,y0)=(fx(x0,y0),fy(x0,y0))为函数在点(x_0,y_0)处的梯度。
则上式可写为:
φ
f
φ
P
Q
→
∣
(
x
0
,
y
0
)
=
∇
f
(
x
0
,
y
0
)
⋅
P
Q
→
=
∣
∇
f
(
x
0
,
y
0
)
∣
∗
∣
P
Q
→
∣
∗
c
o
s
θ
=
∣
∇
f
(
x
0
,
y
0
)
∣
∗
c
o
s
θ
\frac{\varphi f}{\varphi \overrightarrow{PQ}}|_{(x_0,y_0)}=\nabla f(x_0,y_0)\cdot\overrightarrow{PQ}=|\nabla f(x_0,y_0)|*|\overrightarrow{PQ}|*cos\theta=|\nabla f(x_0,y_0)|*cos\theta
φPQφf∣(x0,y0)=∇f(x0,y0)⋅PQ=∣∇f(x0,y0)∣∗∣PQ∣∗cosθ=∣∇f(x0,y0)∣∗cosθ,
θ
\theta
θ为两向量夹角,
θ
∈
[
0
,
π
]
\theta\in[0,\pi]
θ∈[0,π]。
由此可以看出,函数
f
f
f在点
P
P
P的方向
P
Q
→
\overrightarrow{PQ}
PQ的方向导数就是函数
f
f
f在点
P
P
P的梯度在
P
Q
→
\overrightarrow{PQ}
PQ方向上的投影。
在知道了方向导数求法后,我们希望知道某一点的方向导数的最大值,也就是变化最快的方向。
φ
f
φ
P
Q
→
∣
(
x
0
,
y
0
)
=
∣
∇
f
(
x
0
,
y
0
)
∣
∗
c
o
s
θ
\frac{\varphi f}{\varphi \overrightarrow{PQ}}|_{(x_0,y_0)}=|\nabla f(x_0,y_0)|*cos\theta
φPQφf∣(x0,y0)=∣∇f(x0,y0)∣∗cosθ
(因为
P
Q
→
=
(
c
o
s
α
,
c
o
s
β
)
\overrightarrow{PQ}=(cos\alpha,cos\beta)
PQ=(cosα,cosβ)是单位向量。)
随着方向的变动,
∣
∇
f
(
x
0
,
y
0
)
∣
|\nabla f(x_0,y_0)|
∣∇f(x0,y0)∣保持不变。
1)当
θ
=
0
\theta=0
θ=0,即
P
Q
→
\overrightarrow{PQ}
PQ为梯度方向时,
φ
f
φ
P
Q
→
∣
(
x
0
,
y
0
)
\frac{\varphi f}{\varphi \overrightarrow{PQ}}|_{(x_0,y_0)}
φPQφf∣(x0,y0)最大,等于此点梯度的模。
所以我们说梯度方向是函数值上升(的速率)最快的方向。
2)同理,
θ
=
π
\theta=\pi
θ=π,即
P
Q
→
\overrightarrow{PQ}
PQ为负梯度方向时,
φ
f
φ
P
Q
→
∣
(
x
0
,
y
0
)
\frac{\varphi f}{\varphi \overrightarrow{PQ}}|_{(x_0,y_0)}
φPQφf∣(x0,y0)最小,等于此点梯度的模的相反数。
也就是说,负梯度方向是函数值下降(的速率)最快的方向。
从另一角度来说
梯度由偏导数组成,偏导数和导数意义类似。
当偏导数
f
x
(
x
0
,
y
0
)
>
0
f_x(x_0,y_0)>0
fx(x0,y0)>0,说明因变量随着自变量
x
x
x的增大而增大。要想因变量增大,自变量的位移
Δ
x
\Delta x
Δx应该大于0。前进方向和偏导数指向方向一致,
x
=
x
+
Δ
x
x = x+\Delta x
x=x+Δx。
当偏导数
f
x
(
x
0
,
y
0
)
<
0
f_x(x_0,y_0)<0
fx(x0,y0)<0,说明因变量随着自变量
x
x
x的增大而减小。要想因变量增大,自变量的位移
Δ
x
\Delta x
Δx应该小于0。前进方向和偏导数指向方向一致,依然只需
x
=
x
+
Δ
x
x = x+\Delta x
x=x+Δx。
因此梯度方向始终是函数值增大的方向。