定义2
∂fj/∂xi
存在的话,定义如下:
在上篇文章中,我们看到对于 f:R→R 而言 Df(x) 只是线性映射,这个事实可以推广到下面的定理。
定理2
假设
A⊂Rn
是一个开集并且
f:A→Rm
是可微的,那么偏微分
∂fj∂xi
存在且线性映射
Df(x)
对于
Rn,Rm
中标准基的矩阵为
其中每个偏导数都是在 x=(x1,…,xn) 处计算出来的,这个矩阵称为 f 的雅克比(Jacobian) 矩阵。
在实际计算中我们通常可以很容易的计算雅克比矩阵。
当
将导数应用到向量
e=(a1,…,an)
上得
需要强调的是
Df
在每个
x∈A
处都是线性映射并且
Df(x)
的定义与所用的基无关。如果我们从标准基变到其他即,那么矩阵元素自然会改变。如果查看线性变换矩阵的定义,那么我们将看到矩阵对于新基的列就是导数
Df(x)
应用到
Rn
的新基上,当然线性映射
Df(x)
在不同基之间变换时自身不会发生变化。当
m=1
时
Df(x)
是一个
1×n
矩阵,元素与
Df(x)
相同的向量称为
f
的梯度(gradient),表示成
(有时我们说 grad f 仅仅是 ∇f 中插入逗号!)
当
f=L
是线性的时候,我们就得到一个非常重要的特殊情况,根据定义可以看出
DL=L
,这是因为线性映射的最佳仿射近似就是线性映射本身,从而在这种情况下
L
的雅克比矩阵就是
例1: 令 f:R2→R3,f(x,y)=(x2,x3y,x4y2) ,计算 Df 。
解:
根据定理2,
Df(x,y)
是线性映射,其矩阵是
其中 f1(x,y)=x2,f2(x,y)=x3y,f3(x,y)=x4y2 。
例2: 令 L:Rn→Rm 是线性映射(即 L(x+y)=L(x)+L(y),L(αx)=αL(x) ),说明 DL(x)=L 。
解:
给定
x0,ε>0
,我们必须找到
δ>0
使得
∥x−x0∥<δ
意味着
但是
DL(x)=L
,所以左边变为
根据
L
的线性可知,
例3: 令 f(x,y,z)=x(siny)/z ,计算 grad f 。
解:
grad f=(∂f/∂x,∂f/∂y,∂f/∂z)
,对该例来说
所以