梯度
如果我们把导数理解为微小变化引起的变化:
泰勒级数如下:
经常因为计算的原因我们可以利用线性的部分来做近似:
这也 make sense,相当于我们找到
处的切线,然后来看变化,毕竟这就是导数的本质定义。
这种思路对于具有多变量的函数应当也是适用的,比如空间中的曲面f(x,y):
对于这样的曲面,我们如果想要在
附近做线性的近似,那当然应该找到它对应的切平面。而切平面的方程为:
(切平面的方程可以通过找到x方向与y方向的切线,然后cross product得到法向量来证明。)
非常重要的是,上面这个式子同时也某种程度上回应了偏导数的本质,就是我们看x变量(方向)上的微小变化引起的变化,再加上y变量(方向)的微小变化引起的变化,就是总的变化。即使维度增加,线性模拟的式子应该也是类似的,比如函数 f(x,y,z) 在 (a,b,c) 处的线性近似应该是:
这也帮我们自然而然的引出了梯度(gradient)的概念: