1.9 线性变换的矩阵（第1章线性代数中的线性方程组）

最新推荐文章于 2022-06-19 11:26:06 发布

泰克尼客

最新推荐文章于 2022-06-19 11:26:06 发布

阅读量827

点赞数 2

分类专栏：线性代数及其应用系列笔记文章标签：线性代数数学线性变换机器学习矩阵

本文链接：https://blog.csdn.net/wo94chunjie/article/details/103155868

版权

线性代数及其应用系列笔记专栏收录该内容

22 篇文章 59 订阅

订阅专栏

内容概述

本节首先指出了线性变换和矩阵变换的等价性，并介绍了用矩阵来描述线性变换的方法；接着，举了几个二维空间线性变换的几何特性；最后，从线性变换的角度讨论了解的存在性和唯一性问题，并和之前的概念进行了关联。

$\mathbb R^n$ 到 $\mathbb R^m$ 的线性变换和矩阵变换的关系

下面的讨论指出，

从 $\mathbb R^n$ 到 $\mathbb R^m$ 的每一个线性变换实际上都是一个矩阵变换 $\boldsymbol x \rightarrow A\boldsymbol x$ ，
变换 $\boldsymbol T$ 的重要性质都归结为 $A$ 的性质。
寻找矩阵 $A$ 的关键是了解 $\boldsymbol T$ 完全由它对 $\times n$ 单位矩阵 $\boldsymbol I_n$ 的各列的作用所决定。
例：

$\boldsymbol I_n = \begin{bmatrix}1 & 0 \\ 0 & 1\end{bmatrix}$ 的两列是 $\boldsymbol e_1 = \begin{bmatrix}1 \\ 0\end{bmatrix}$ 和 $\boldsymbol e_2 = \begin{bmatrix}0 \\ 1\end{bmatrix}$ ，设 $\boldsymbol T$ 是 $\mathbb R^2$ 到 $\mathbb R^3$ 的线性变换，满足：
$\boldsymbol T(\boldsymbol e_1) = \begin{bmatrix}5 \\ 7 \\ -2\end{bmatrix}, \boldsymbol T(\boldsymbol e_2) = \begin{bmatrix}-3 \\ 8 \\ 0\end{bmatrix}$
在此条件下求出 $\mathbb R^2$ 中任意向量 $\boldsymbol x$ 的像的公式。

解：

对于 $\mathbb R^2$ 中的任意向量 $\boldsymbol x$ ，有：
$\boldsymbol x = \begin{bmatrix}x_1 \\ x_2\end{bmatrix} = x_1\begin{bmatrix}1 \\ 0\end{bmatrix} + x_2\begin{bmatrix}0 \\1\end{bmatrix} = x_1\boldsymbol e_1 + x_2\boldsymbol e_2$
因为 $\boldsymbol T$ 是线性变换，所以有：
$\boldsymbol T(\boldsymbol x)=x_1\boldsymbol T(\boldsymbol e_1)+x_2\boldsymbol T(e_2)=x_1\begin{bmatrix}5 \\ 7 \\-2\end{bmatrix} + x_2\begin{bmatrix}-3 \\ 8 \\0\end{bmatrix} = \begin{bmatrix}5x_1-3x_2 \\ 7x_1+8x_2 \\-2x_1 + 0\end{bmatrix}$
如果把上述 $\boldsymbol T(\boldsymbol e_1)$ 和 $\boldsymbol T(\boldsymbol e_2)$ 作为矩阵的列，把上式写成向量相乘的形式，那么可以得到下面的公式：
$\boldsymbol T(\boldsymbol x) = [\boldsymbol T(\boldsymbol e_1)\quad \boldsymbol T(\boldsymbol e_2)]\begin{bmatrix}x_1 \\ x_2\end{bmatrix} = A\boldsymbol x$
上面举的例子是一个感性认识，下面是定理和证明：
定理：
设 $\boldsymbol T:\mathbb R^n \rightarrow \mathbb R^m$ 为线性变换，则存在唯一的矩阵 $A$ ，使得对 $\mathbb R^n$ 中一切 $\boldsymbol x$ ，
$\boldsymbol T(\boldsymbol x) = A\boldsymbol x$
事实上， $A$ 是 $\times n$ 矩阵，它的第 $j$ 列是向量 $\boldsymbol T(\boldsymbol e_j)$ ，其中 $\boldsymbol e_j$ 是 $\mathbb R^n$ 中单位矩阵 $\boldsymbol I_n$ 的第 $j$ 列：
$[\boldsymbol T(\boldsymbol e_1)\quad \cdots \quad \boldsymbol T(\boldsymbol e_n)]$

证明：

记 $\boldsymbol x = \boldsymbol I_n\boldsymbol x = [\boldsymbol e_1 \quad \cdots \quad \boldsymbol e_n]\boldsymbol x = x_1\boldsymbol e_1 + \cdots +x_n\boldsymbol e_n$ ，由于 $\boldsymbol T$ 是线性变换，知：
$\boldsymbol T(\boldsymbol x)=\boldsymbol T(x_1\boldsymbol e_1 + \cdots + x_n\boldsymbol e_n) = x_1\boldsymbol T(\boldsymbol e_1) + \cdots + x_n\boldsymbol T(\boldsymbol e_n) = [\boldsymbol T(\boldsymbol e_1) \quad \cdots \quad \boldsymbol T(\boldsymbol e_n)]\begin{bmatrix}x_1 \\ ...\\ x_n\end{bmatrix} = A\boldsymbol x$
矩阵 $A$ 称为线性变换 $\boldsymbol T$ 的标准矩阵。
上述讨论表明了：由 $\mathbb R^n$ 到 $\mathbb R^m$ 的每个线性变换都可看作矩阵变换，反之亦然。并且：

线性变换强调映射的性质
矩阵变换描述该映射的具体实现

例：

设 $\boldsymbol T: \mathbb R^2 \rightarrow \mathbb R^2$ 为把 $\mathbb R^2$ 中每一个点绕原点逆时针旋转正角度 $\varphi$ 的变换。求出这个变换的标准矩阵。

解：

$\begin{bmatrix}1 \\ 0 \end{bmatrix}$ 变换为 $\begin{bmatrix}\cos \varphi \\ \sin \varphi \end{bmatrix}$ ， $\begin{bmatrix}0 \\ 1\end{bmatrix}$ 变换为 $\begin{bmatrix}-\sin \varphi \\ \cos \varphi \end{bmatrix}$ ，由上述定理可知：
$\begin{bmatrix}\cos \varphi & -\sin \varphi \\ \sin \varphi & \cos \varphi \end{bmatrix}$

$\mathbb R^2 \rightarrow \mathbb R^2$ 线性变换的几何变换举例

下图表示了几种 $\mathbb R^2 \rightarrow \mathbb R^2$ 线性变换的几何图像表现。因为这些变换都是线性的，故它们完全由变换对 $\boldsymbol I_2$ 的作用决定。
在这里插入图片描述

存在与唯一性问题

这里从线性变换的角度来思考存在性与唯一性的问题。
首先引入两个定义：
定义1：

映射 $\boldsymbol T: \mathbb R^n \rightarrow R^m$ 称为到 $R^m$ 上的映射，若 $R^m$ 中每个 $\boldsymbol b$ 是 $\mathbb R^n$ 中至少一个 $\boldsymbol x$ 的像（也称为满射）。

定义2：

映射 $\boldsymbol T: \mathbb R^n \rightarrow R^m$ 称为一对一映射（或1：1），若 $\mathbb R^m$ 中每个 $\boldsymbol b$ 是 $\mathbb R^n$ 中至多一个 $\boldsymbol x$ 的像（也称为单射）。

定义1描述的是存在性问题，也可以等价于下面的语句：

当 $\boldsymbol T$ 的值域是整个余定义域 $\mathbb R^m$ 时， $\boldsymbol T$ 是到 $\mathbb R^m$ 上的。
对 $\mathbb R^m$ 中每个 $\boldsymbol b$ ，方程 $\boldsymbol T(x) = \boldsymbol b$ 至少有一个解，也就是说，方程 $\boldsymbol T(x) = \boldsymbol b$ 是相容的。

对应的，如果 $\mathbb R^m$ 中有某个 $\boldsymbol b$ ，使得方程 $\boldsymbol T(\boldsymbol x) = \boldsymbol b$ 无解，那么映射 $\boldsymbol T$ 不是到 $\mathbb R^m$ 上的。
在这里插入图片描述
定义2描述的是唯一性问题。对于 $\mathbb R^m$ 中每个 $\boldsymbol b$ ，对应于如下两种情况：

方程 $\boldsymbol T(x) = \boldsymbol b$ 有唯一的解
方程 $\boldsymbol T(x) = \boldsymbol b$ 无解

例：

设 $\boldsymbol T$ 是线性变换，它的标准矩阵为：
$\begin{bmatrix}1 & -4 & 8 & 1 \\ 0 & 2 & -1 & 3 \\0 & 0 & 0 & 5\end{bmatrix}$
$\boldsymbol T$ 是否把 $\mathbb R^4$ 映上到 $\mathbb R^3$ ？ $\boldsymbol T$ 是否是一对一映射？

解：

由于上述矩阵是阶梯形矩阵，且每一行均有主元位置，因此，对于 $\mathbb R^3$ 中的每个 $\boldsymbol b$ ，方程 $A\boldsymbol x = \boldsymbol b$ 是相容的。因此， $\boldsymbol T$ 将 $\mathbb R^4$ 映射到 $\mathbb R^3$ 上。
因为 $A\boldsymbol x = \boldsymbol b$ 含有自由变量（4列有四个变量，但只有3行，每一行一个主元，所以只有3个基本变量），所以每个 $\boldsymbol b$ 都有多个 $\boldsymbol x$ 的像，所以 $\boldsymbol T$ 不是一对一的。

下面的定理很重要，把线性无关和线性变换的概念联系了起来。
定理：

设 $\boldsymbol T: \mathbb R^n \rightarrow \mathbb R^m$ 为线性变换，则 $\boldsymbol T$ 是一对一的当且仅当方程 $A\boldsymbol x = \boldsymbol 0$ 仅有平凡解。

证明：

若 $\boldsymbol T$ 是一对一的。又因 $\boldsymbol T$ 是线性的，故 $\boldsymbol T(\boldsymbol 0) = \boldsymbol 0$ ，所以方程 $\boldsymbol T(\boldsymbol x) = \boldsymbol 0$ 仅有一个解，这个解就是平凡解 $\boldsymbol 0$ 。
若 $\boldsymbol T$ 不是一对一的。则 $\mathbb R^m$ 中某个 $\boldsymbol b$ 是 $\mathbb R^n$ 中至少两个相异向量的像（假设这两个向量分别是 $\boldsymbol u$ ， $\boldsymbol v$ ），因此有 $\boldsymbol T(\boldsymbol u) = \boldsymbol b$ ， $\boldsymbol T(\boldsymbol v) = \boldsymbol b$ 。又因为 $\boldsymbol T$ 是线性的，所以有： $\boldsymbol T(\boldsymbol u-\boldsymbol v)=\boldsymbol T(\boldsymbol u) - \boldsymbol T(\boldsymbol v) = \boldsymbol b -\boldsymbol b =\boldsymbol 0$
由于 $\boldsymbol u \neq \boldsymbol v$ ，所以向量 $\boldsymbol u - \boldsymbol v$ 不是零向量，又因为 $\boldsymbol T(\boldsymbol 0) = \boldsymbol 0$ ，所以方程 $\boldsymbol T(x) = \boldsymbol 0$ 有多于一个解

综上，定理中的两个条件同时成立或同时不成立，因此该定理得证。

根据上述定理，结合以前学到的内容，又可以归纳出下述定理：
定理：

设 $\boldsymbol T: \mathbb R^n \rightarrow \mathbb R^m$ 是线性变换，设 $A$ 为 $\boldsymbol T$ 的标准矩阵，则：

$\boldsymbol T$ 把 $\mathbb R^n$ 映上到 $\mathbb R^m$ ，当且仅当 $A$ 的各列生成 $\mathbb R^m$
$\boldsymbol T$ 是一对一的，当且仅当 $A$ 的各列线性无关

例：

设 $\boldsymbol T(x_1, x_2) = (3x_1 + x_2, 5x_1 +7x_2, x_1+3x_2)$ ，证明 $\boldsymbol T$ 是一对一线性变换。 $\boldsymbol T$ 是否将 $\mathbb R^2$ 映上到 $\mathbb R^3$ ？

解：

$\boldsymbol T(x) = \begin{bmatrix}3x_1 + x_2 \\ 5x_1 + 7x_2 \\x_1+3x_2\end{bmatrix} = \begin{bmatrix}3 & 1 \\ 5 & 7\\1 &3\end{bmatrix}\begin{bmatrix}x_1 \\ x_2\end{bmatrix}$
故 $\boldsymbol T$ 的确是线性变换，它的标准矩阵如上式所示。 $A$ 的列是线性无关的，因为它们互相之间不是倍数关系，所以， $\boldsymbol T$ 是一对一的。
另外，由1.4节的定理（ $A$ 的各列生成 $\mathbb R^m$ 等价于 $A$ 在每一行都有一个主元位置），由于 $A$ 只有两列，而一行的主元均需在上一行的右边，而这是不可能的，所以 $A$ 的各列不能生成 $\mathbb R^3$ ，对应的线性变换不是映上到 $\mathbb R^3$ 的。