漫步数学分析三十一——矩阵表示

最新推荐文章于 2023-06-27 21:16:59 发布

会敲键盘的猩猩

最新推荐文章于 2023-06-27 21:16:59 发布

阅读量787

点赞数

分类专栏：漫步数学分析文章标签：雅克比矩阵

漫步数学分析专栏收录该内容

48 篇文章 54 订阅

订阅专栏

$\textbf{定义2}$ $\partial f_j/\partial x_i$ 存在的话，定义如下：

\partial f j \partial x i (x 1, \dots, x n) = lim h \to 0 {f j ( x 1 , \dots , x i + h , \dots , x n ) - f j ( x 1 , \dots , x n ) h}

$\frac{\partial f_j}{\partial x_i}(x_1,\ldots,x_n)=\lim_{h\to 0}\left\{\frac{f_j(x_1,\ldots,x_i+h,\ldots,x_n)-f_j(x_1,\ldots,x_n)}{h}\right\}$

在上篇文章中，我们看到对于 $f:R\to R$ 而言 $Df(x)$ 只是线性映射，这个事实可以推广到下面的定理。

$\textbf{定理2}$ 假设 $A\subset R^n$ 是一个开集并且 $f:A\to R^m$ 是可微的，那么偏微分 $\partial f_j\partial x_i$ 存在且线性映射 $Df(x)$ 对于 $R^n,R^m$ 中标准基的矩阵为

⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ \partial f 1 \partial x 1 \partial f 2 \partial x 1 \cdot \cdot \cdot \partial f m \partial x 1 \partial f 1 \partial x 2 \partial f 2 \partial x 2 \cdot \cdot \cdot \partial f m \partial x 2 \dots \dots \dots \partial f 1 \partial x n \partial f 2 \partial x n \cdot \cdot \cdot \partial f m \partial x n ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟

$\begin{pmatrix} \frac{\partial f_1}{\partial x_1}&\frac{\partial f_1}{\partial x_2}&\cdots&\frac{\partial f_1}{\partial x_n}\\ \frac{\partial f_2}{\partial x_1}&\frac{\partial f_2}{\partial x_2}&\cdots&\frac{\partial f_2}{\partial x_n}\\ \cdot&\cdot&&\cdot\\ \cdot&\cdot&&\cdot\\ \cdot&\cdot&&\cdot\\ \frac{\partial f_m}{\partial x_1}&\frac{\partial f_m}{\partial x_2}&\cdots&\frac{\partial f_m}{\partial x_n} \end{pmatrix}$

其中每个偏导数都是在 $x=(x_1,\ldots,x_n)$ 处计算出来的，这个矩阵称为 $f$ 的雅克比(Jacobian) 矩阵。

在实际计算中我们通常可以很容易的计算雅克比矩阵。

当 $m=1$ 时我们得到其特殊情况，此时我们有一个 $n$ 变量的实值函数，那么 $Df$ 存在矩阵

(\partial f x 1 \dots \partial f \partial x n)

$\left(\frac{\partial f}{x_1}\cdots\frac{\partial f}{\partial x_n}\right)$

将导数应用到向量 $e=(a_1,\ldots,a_n)$ 上得

D f (x) \cdot e = \sum i = 1 n \partial f \partial x i a i

$Df(x)\cdot e=\sum_{i=1}^n\frac{\partial f}{\partial x_i}a_i$

需要强调的是 $Df$ 在每个 $x\in A$ 处都是线性映射并且 $Df(x)$ 的定义与所用的基无关。如果我们从标准基变到其他即，那么矩阵元素自然会改变。如果查看线性变换矩阵的定义，那么我们将看到矩阵对于新基的列就是导数 $Df(x)$ 应用到 $R^n$ 的新基上，当然线性映射 $Df(x)$ 在不同基之间变换时自身不会发生变化。当 $m=1$ 时 $Df(x)$ 是一个 $1\times n$ 矩阵，元素与 $Df(x)$ 相同的向量称为 $f$ 的梯度(gradient)，表示成 $\text{grad}\ f$ 或 $\nabla f$ ，因此对于

f : A \subset R n \to R, grad f = (\partial f \partial x 1, \dots, \partial f \partial x n)

$f:A\subset R^n\to R,\text{grad}\ f=\left(\frac{\partial f}{\partial x_1},\cdots,\frac{\partial f}{\partial x_n}\right)$

(有时我们说 $\text{grad}\ f$ 仅仅是 $\nabla f$ 中插入逗号！)

当 $f=L$ 是线性的时候，我们就得到一个非常重要的特殊情况，根据定义可以看出 $DL=L$ ，这是因为线性映射的最佳仿射近似就是线性映射本身，从而在这种情况下 $L$ 的雅克比矩阵就是 $L$ 本身的矩阵。另一种有趣的情况是常数映射，实际上我们会看到常数映射导数为零；零是线性映射 $f:R^n\to R^m$ ，满足对所有的 $x\in R^n,f(x)=0=(0,\ldots,0)$ 。

$\textbf{例1：}$ 令 $f:R^2\to R^3,f(x,y)=(x^2,x^3y,x^4y^2)$ ，计算 $Df$ 。

$\textbf{解：}$ 根据定理2， $Df(x,y)$ 是线性映射，其矩阵是

⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ \partial f 1 \partial x \partial f 2 \partial x \partial f 3 \partial x \partial f 1 \partial y \partial f 2 \partial y \partial f 3 \partial y ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ = ⎛ ⎝ ⎜ 2 x 3 x 2 y 4 x 3 y 2 0 x 3 2 x 4 y ⎞ ⎠ ⎟

$\begin{pmatrix} \frac{\partial f_1}{\partial x}&\frac{\partial f_1}{\partial y}\\ \frac{\partial f_2}{\partial x}&\frac{\partial f_2}{\partial y}\\ \frac{\partial f_3}{\partial x}&\frac{\partial f_3}{\partial y} \end{pmatrix}= \begin{pmatrix} 2x&0\\ 3x^2y&x^3\\ 4x^3y^2&2x^4y \end{pmatrix}$

其中 $f_1(x,y)=x^2,f_2(x,y)=x^3y,f_3(x,y)=x^4y^2$ 。

$\textbf{例2：}$ 令 $L:R^n\to R^m$ 是线性映射(即 $L(x+y)=L(x)+L(y),L(\alpha x)=\alpha L(x)$ )，说明 $DL(x)=L$ 。

$\textbf{解：}$ 给定 $x_0,\varepsilon>0$ ，我们必须找到 $\delta>0$ 使得 $\Vert x-x_0\Vert<\delta$ 意味着

∥ L (x) - L (x 0) - D L (x) \cdot (x - x 0) ∥ \leq ε ∥ x - x 0 ∥

$\Vert L(x)-L(x_0)-DL(x)\cdot(x-x_0)\Vert\leq\varepsilon\Vert x-x_0\Vert$

但是 $DL(x)=L$ ，所以左边变为

∥ L (x) - L (x 0) - L (x - x 0) ∥

$\Vert L(x)-L(x_0)-L(x-x_0)\Vert$

根据 $L$ 的线性可知， $L(x-x_0)=L(x)-L(x_0)$ ，所以上式等于零，从而 $DL(x)=L$ 满足定义(对任意 $\delta>0$ )。

$\textbf{例3：}$ 令 $f(x,y,z)=x(\sin y)/z$ ，计算 $\text{grad}\ f$ 。

$\textbf{解：}$ $\text{grad}\ f=(\partial f/\partial x,\partial f/\partial y,\partial f/\partial z)$ ，对该例来说

\partial f \partial x = ( sin y ) z, \partial f \partial y = z ( cos y ) z, \partial f \partial z = - x ( sin y ) z 2

$\frac{\partial f}{\partial x}=\frac{(\sin y)}{z},\quad\frac{\partial f}{\partial y}=\frac{z(\cos y)}{z},\quad\frac{\partial f}{\partial z}=-\frac{x(\sin y)}{z^2}$

所以