最初的疑惑
在梯度的Wiki 上对梯度在三维空间,直角坐标系下的梯度表示为
∇ = ∂ f ( x , y , z ) ∂ x ∗ i ⃗ + ∂ f ( x , y , z ) ∂ y ∗ j ⃗ + ∂ f ( x , y , z ) ∂ z ∗ k ⃗ \nabla = \frac{\partial{f(x, y, z)}}{\partial{x}}*\vec{i}+\frac{\partial{f(x, y, z)}}{\partial{y}}*\vec{j}+\frac{\partial{f(x, y, z)}}{\partial{z}}*\vec{k} ∇=∂x∂f(x,y,z)∗i+∂y∂f(x,y,z)∗j+∂z∂f(x,y,z)∗k
为什么梯度是由函数 f ( x , y , z ) f(x, y ,z) f(x,y,z)在每个方向上的偏导乘以向量然后相加呢?
希望回答的问题
- 梯度是什么?
- 梯度是怎么来的?
- 梯度怎么表示?
- 梯度为什么这么表示?
- 为什么梯度的反方向是函数值下降最快的方向?
梯度是什么?
梯度是个向量,在某个点的梯度定义有两部分组成:1)梯度的方向:在当前点函数值增长最快的方向 2)梯度的值:函数在当前点最大的增长率 ∣ ∇ f ∣ |\nabla{f}| ∣∇f∣。
从这个描述当中我们可以把最初的疑惑,分解为两个问题
- 为什么上面的向量表示的方向是函数值增长最快的方向
- 为什么这个向量表示的长度为最大的增长率
梯度是怎么来的?
为了回答以上的问题,我们需要知道梯度是怎么来的,这是我们需要引入方向导数。
方向导数的定义:假设 f f f为 R n R^n Rn上的函数,且包含某个区间 D D D, P 0 P_0 P0为 D D D上的一个点, l ⃗ \vec{l} l为一个非零向量,如果极限
lim t → 0 f ( P 0 x 1 + l x 1 t , P 0 x 2 + l x 2 t , . . . ) − f ( P 0 x 1 , P 0 x 2 , . . . ) t \lim_{t \to 0}\frac{f(P_{0x1} + l_{x1}t, P_{0x2} + l_{x2}t, ...) - f(P_{0x1}, P_{0x2}, ...)}{t} t→0limtf(P0x1+lx1t,P0x2+lx2t,...)−f(