矩阵篇（二）-- 线性变换的矩阵表示、常用变换及其矩阵、常见的特殊矩阵

长路漫漫2021

已于 2022-10-24 18:33:56 修改

阅读量2.1w

点赞数 8

分类专栏： Math 文章标签：线性代数线性变换常见的特殊矩阵矩阵的等价关系

于 2021-10-24 12:24:38 首次发布

本文链接：https://blog.csdn.net/xq151750111/article/details/120789030

版权

Math 专栏收录该内容

20 篇文章

订阅专栏

1 线性变换与矩阵

1.1 线性变换及其运算

定义
        设 $V$ 是数域 $K$ 上的线性空间， $T$ 是 $V$ 到自身的一个映射，使得对于 $V$ 中的任意元素 $\boldsymbol{x}$ 均存在唯一的 $\boldsymbol{y} \in V$ 与之对应，则称 $T$ 为 $V$ 的一个变换或算子，记为：
$T(\boldsymbol{x}) = \boldsymbol{y} \tag{1-1}$
        称 $\boldsymbol{y}$ 为 $\boldsymbol{x}$ 在变换 $T$ 下的象， $\boldsymbol{x}$ 为 $\boldsymbol{y}$ 的原象（或象源）。
        如果数域 $K$ 上的线性空间 $V$ 的一个变换 $T$ 具有下列性质（齐次可加性）：对任意 $\boldsymbol{x, y} \in V，k, l \in K$ ，都有， $T(k\boldsymbol{x} + l\boldsymbol{y}) = kT(\boldsymbol{x}) + lT(\boldsymbol{y}) \tag{1-2}$
        则称 $T$ 为 $V$ 的一个线性变换或线性算子。
性质
（1）线性变换把零元素仍变为零元素
（2）负元素的象为原来元素的象的负元素
（3）线性变换把线性相关的元素组仍变为线性相关的元素组
注：线性无关的元素组经过线性变换不一定再是线性无关的，变换后的情况与元素组和线性变换有关。若线性变换 $T$ 将所有的元素组仍变换为线性无关的元素组，则称之为满秩的线性变换，其变换矩阵为满秩矩阵。
线性变换的运算
（1）恒等变换(单位变换) $T_e： \forall \boldsymbol{x} \in V， T_e\boldsymbol{x} = \boldsymbol{x}$
（2）零变换 $T_0：\forall \boldsymbol{x} \in V， T_0\boldsymbol{x} = 0$
（3）变换的相等： $T_1、T_2$ 是 $V$ 的两个线性变换， $\forall \boldsymbol{x} \in V$ ，均有 $T_1\boldsymbol{x} = T_2\boldsymbol{x}$ ，则称 $T_1 = T_2$
（4）线性变换的和 $T_1 + T_2：\forall \boldsymbol{x} \in V，(T_1+T_2)\boldsymbol{x} = T_1\boldsymbol{x} +T_2\boldsymbol{x}$
（5）线性变换的数乘 $kT：\forall \boldsymbol{x} \in V，(kT)\boldsymbol{x} = k(T\boldsymbol{x})$
负变换： $(-T)\boldsymbol{x} = -(T\boldsymbol{x})$
（6）线性变换的乘积 $T_1T_2：\forall \boldsymbol{x} \in V，(T_1T_2)\boldsymbol{x} = T_1(T_2\boldsymbol{x})$
（7）逆变换 $T^{-1}：\forall \boldsymbol{x} \in V$ ，若存在线性变换 $S$ 使得 $(ST)\boldsymbol{x} = (TS)\boldsymbol{x} = \boldsymbol{x}$ ，则称 $S$ 为 $T$ 的逆变换，即 $S = T^{-1}$
（8）线性变换的多项式：
$T^n = \underbrace{TT \cdots T}_{n}，并规定 T^0 = T_e \\ f(t) = \sum_{n=0}^{N}a_nT^n \to f(T)\boldsymbol{x} = \sum_{n=0}^{N}a_nT^n\boldsymbol{x} \tag{1-3}$
注：和矩阵的乘积一样，线性变换的乘积不满足交换律；不是所有的变换都具有逆变换，只有满秩变换才有逆变换， $ST = T_e$ 。

1.2 线性变换的矩阵表示

1. 推导
设 $T$ 是线性空间 $V_n$ 的线性变换， $\boldsymbol{x} \in V_n$ ，且 $\boldsymbol{x_1, x_2, \cdots, x_n}$ 是 $V_n$ 的一个基，则有：
$\boldsymbol{x} = a_1\boldsymbol{x_1}+a_2\boldsymbol{x_2}+ \cdots +a_n\boldsymbol{x_n} \\ \quad T\boldsymbol{x} = a_1(T\boldsymbol{x_1})+a_2(T\boldsymbol{x_2})+ \cdots +a_n(T\boldsymbol{x_n}) \tag{1-4}$
这表明， $V^n$ 中任一向量 $\boldsymbol{x}$ 的象由基象组 $T\boldsymbol{x_1}，T\boldsymbol{x_2}，\cdots，T\boldsymbol{x_n}$ 唯一确定。因为基象组仍属于 $V_n$ ，故可令

$\begin{cases} T\boldsymbol{x_1} = a_{11}\boldsymbol{x_1} + a_{21}\boldsymbol{x_2} + \cdots + a_{n1}\boldsymbol{x_n},\\ T\boldsymbol{x_2} = a_{12}\boldsymbol{x_1} + a_{22}\boldsymbol{x_2} + \cdots + a_{n2}\boldsymbol{x_n}, \\ \qquad\qquad\qquad\quad\cdots \cdots \\ T\boldsymbol{x_n} = a_{1n}\boldsymbol{x_1} + a_{2n}\boldsymbol{x_2} + \cdots + a_{nn}\boldsymbol{x_n}, \end{cases} \tag{1-5}$
        即
$T\boldsymbol{x_i}=\sum_{j=1}^{n}a_{ji}\boldsymbol{x_i} \qquad （i= 1，2，\cdots，n）\tag{1-6}$
        采用矩阵乘法的形式，式(1-5)可表示为
$T(\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n}) \overset{def}{=} （T\boldsymbol{x_1}, T\boldsymbol{x_2}, \cdots, T\boldsymbol{x_n}）= (\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n})\boldsymbol{A} \tag{1-7}$
        其中
$\boldsymbol{A} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix} \tag{1-8}$

矩阵 $\boldsymbol{A}$ 的第 $i$ 列恰是 $T\boldsymbol{x_i}$ 的坐标( $\cdots, n$ )。

        式(1-7)中的矩阵 $\boldsymbol{A}$ 称为 $T$ 在 $V_n$ 基 $\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n}$ 下的矩阵，简称 $\boldsymbol{A}$ 为 $T$ 的矩阵。
        注： 对于任意 $n$ 阶矩阵 $\boldsymbol{A}$ 存在唯一的一个线性变换 $T$ 。所以线性变换可以用矩阵来表示。
         $T_0$ 的矩阵为 $\boldsymbol{O}$ ， $T_e$ 的矩阵为 $\boldsymbol{I}$ ， $T_m$ 的矩阵为 $m\boldsymbol{I}$ （数量矩阵）。

详细推导，请阅读：线性代数笔记——线性变换及对应矩阵。
2. 定理

定理一：设 $\boldsymbol{x_1, x_2, \cdots, x_n}$ 是 $V^n$ 的一个基， $T_1、T_2$ 在该基下的矩阵分别为 $\boldsymbol{A、B}$ 。则有：
（1） $(T_1 + T_2)[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](\boldsymbol{A+B})$
（2） $kT[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](k\boldsymbol{A})$
（3） $(T_1 T_2)[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](\boldsymbol{AB})$
（4） $T^{-1}[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}]\boldsymbol{A}^{-1}$
定理二：设线性变换 $T$ 在 $V^n$ 的基 $\boldsymbol{x_1, x_2, \cdots, x_n}$ 下的矩阵 $\boldsymbol{A}=(a_{ij})$ ，向量 $\boldsymbol{x}$ 在该基下的坐标是 $(\xi_1, \xi_2, \cdots, \xi_n)^T$ ，则 $T\boldsymbol{x}$ 在该基下的坐标 $(\eta_1, \eta_2, \cdots, \eta_n)^T$ 满足
$(\eta_1, \eta_2, \cdots, \eta_n)^T = \boldsymbol{A}(\xi_1, \xi_2, \cdots, \xi_n)^T \tag{1-9}$
定理三：设 $V^n$ 的线性变换 $T$ ，对于 $V^n$ 的两个基 $\boldsymbol{x_1, x_2, \cdots, x_n}$ 和 $\boldsymbol{y_1, y_2, \cdots, y_n}$ 的矩阵依次是 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ ，并且
$\boldsymbol{y_1, y_2, \cdots, y_n} = \boldsymbol{x_1, x_2, \cdots, x_n}\boldsymbol{C} \tag{1-10}$
则可以得到： $\boldsymbol{B} = \boldsymbol{C}^{-1}\boldsymbol{AC}$ 。

矩阵和线性变换之间的关系：矩阵本身描述了一个坐标系，矩阵与矩阵的乘法描述了一个运动（线性变换）。换言之：如果矩阵仅仅自己出现，那么他描述了一个坐标系，如果他和另一个矩阵或向量同时出现，而且做乘法运算，那么它表示运动（线性变换）。

补充： 对线性变换直观的理解可以参考视频：线性代数的本质 - 03 - 矩阵与线性变换和线性代数的本质 - 04 - 矩阵乘法与线性变换复合，学习笔记：https://zhuanlan.zhihu.com/p/111123005

2 常用变换及其矩阵

2.1 正交变换与正交矩阵

1. 定义
设 $V$ 是一个欧式空间， $T$ 是 $V$ 上的一个线性变换，如果对于任何向量 $\boldsymbol{x}, \boldsymbol{y} \in V$ ，变换 $T$ 恒能使下式成立（即不改变向量的內积）：
$(T(\boldsymbol{x}), T(\boldsymbol{y})) = (\boldsymbol{x}, \boldsymbol{y}) \tag{2-1}$
则称 $T$ 是 $V$ 上的正交变换。
2. 性质

定理一：设 $T$ 是欧式空间 $V$ 上的线性变换，下面写出的任一条件都是 $T$ 成为正交变换的充要条件：
（1）T 是向量长度保持不变，即：对任何 $\boldsymbol{x} \in V$ ，有
$(T(\boldsymbol{x}), T(\boldsymbol{x})) = (\boldsymbol{x}, \boldsymbol{x})；\tag{2-2}$
（2）任一组标准正交基经 $T$ 变换后的象仍是一组标准正交基；
（3） $T$ 在任意一组标准正交基下的矩阵 $\boldsymbol{A}$ 满足
$\boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^{T}=\boldsymbol{I} \quad 或 \quad \boldsymbol{A}^{-1} = \boldsymbol{A}^{T} \tag{2-3}$
定理二：在欧氏空间中，正交变换在标准正交基下的矩阵是正交矩阵；反过来，如果线性变换 $T$ 在标准正交基下的矩阵是正交矩阵，则 $T$ 是正交变换。

2.2 对称变换与对称矩阵

1. 定义
设 $V$ 是一个欧式空间， $T$ 是 $V$ 上的一个线性变换，如果对于任何向量 $\boldsymbol{x}, \boldsymbol{y} \in V$ ，变换 $T$ 恒能使下式成立：
$(T(\boldsymbol{x}), \boldsymbol{y}) = (\boldsymbol{x}, T(\boldsymbol{y}))\tag{2-4}$
则称 $T$ 是 $V$ 上的一个对称变换。
2. 性质

定理一： $n$ 维欧氏空间 $V$ 的线性变换 $T$ 是对称变换的充要条件是： $T$ 在标准正交基下的矩阵 $\boldsymbol{A}$ 是实对称矩阵，即有 $\boldsymbol{A}^{T} = \boldsymbol{A}$ 。

2.3 Hermite变换及其矩阵

1. 定义
设 $V$ 是一个酉空间， $T$ 是 $V$ 上的一个线性变换，如果对于任何向量 $\boldsymbol{x}, \boldsymbol{y} \in V$ ，变换 $T$ 恒能使下式成立（即不改变向量的內积）：
$(T(\boldsymbol{x}), \boldsymbol{y}) = (\boldsymbol{x}, T(\boldsymbol{y})) \tag{2-5}$
则称 $T$ 是 $V$ 上的一个Hermite变换（厄米特变换）。
2. 性质

定理一：Hermite变换在酉空间的标准正交基下的矩阵 $\boldsymbol{A}$ 是Hermite矩阵，即 $\boldsymbol{A}^{H} = \boldsymbol{A}（H 表示共轭转置）$ 。

3 常见的特殊矩阵

3.1 正交矩阵

1. 定义
如果 $n$ 阶实方阵 $\boldsymbol{A}$ 满足 $\boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{A}^{-1}\boldsymbol{A}=\boldsymbol{I}$ ，则称 $\boldsymbol{A}$ 为正交矩阵，简称正交阵。

2. 性质

正交矩阵是非奇异的，且 $det\boldsymbol{A}=1$ 或-1，（行列式等于1的正交矩阵叫正常的，等于-1的叫非正常的）。
正交矩阵的逆矩阵仍是正交矩阵。
两个正交矩阵的乘积仍为正交矩阵。
实数域上方阵 $\boldsymbol{A}$ 是正交矩阵的充分必要条件是：A的行（或列）向量组为标准正交向量组。

3.2 对称矩阵

1. 定义
如果 $n$ 阶方阵 $\boldsymbol{A}$ 满足 $\boldsymbol{A}^T=\boldsymbol{A}$ ，则称 $\boldsymbol{A}$ 为对称矩阵，简称对称阵。
2. 性质

实对称矩阵的特征值都是实数。
实对称矩阵的不同特征值所对应的特征向量是正交的。

3.3 酉矩阵

1. 定义
若 $n$ 阶复矩阵 $\boldsymbol{A}$ 满足 $\boldsymbol{A}^H\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^H=\boldsymbol{I}$ ，则称 $\boldsymbol{A}$ 是酉矩阵。
2. 性质

酉矩阵的逆矩阵也是酉矩阵，两个有矩阵的乘积还是酉矩阵。

3.4 Hermite矩阵

1. 定义
设 $\boldsymbol{A} \in \boldsymbol{C}^{n \times n}$ ，若 $\boldsymbol{A}^H=\boldsymbol{A}$ ，则称 $\boldsymbol{A}$ 为Hermite矩阵。若 $\boldsymbol{A}^H=-\boldsymbol{A}$ ，则称 $\boldsymbol{A}$ 为反Hermite矩阵。
2. 性质

Hermite矩阵的特征值都是实数。
Hermite矩阵的不同特征值所对应的特征向量是正交的。

3.5 正规矩阵

设 $\boldsymbol{A} \in \boldsymbol{C}^{n \times n}$ ，若 $\boldsymbol{A}\boldsymbol{A}^H=\boldsymbol{A}^H\boldsymbol{A}$ ，则称 $\boldsymbol{A}$ 为正规矩阵。

3.6 幂等矩阵

设 $\boldsymbol{A} \in \boldsymbol{C}^{n \times n}$ ，若 $\boldsymbol{A}^2=\boldsymbol{A}$ ，则称 $\boldsymbol{A}$ 为幂等矩阵。

3.7 奇异矩阵

当 $\lvert \boldsymbol{A} \rvert=0$ 时， $\boldsymbol{A}$ 称为奇异矩阵，否则称非奇异矩阵。由上面两定理可知： $\boldsymbol{A}$ 是可逆矩阵的充分必要条件是 $\lvert \boldsymbol{A} \rvert \not= 0$ ，即可逆矩阵就是非奇异矩阵。

3.8 初等矩阵

初等矩阵是指由单位矩阵经过一次初等变换得到的矩阵。初等变换有三种：（1）交换矩阵中某两行（列）的位置；（2）用一个非零常数 $k$ 乘以矩阵的某一行（列）；（3）将矩阵的某一行（列）乘以常数 $k$ 后加到另一行（列）上去。

3.9 正定矩阵

正定矩阵是一种实对称矩阵。正定二次型 $f(x_1, x_2, \cdots, x_n)=\boldsymbol{X}^T\boldsymbol{AX}$ 的矩阵 $\boldsymbol{A}$ 称为正定矩阵。
（1）广义定义：设 $\boldsymbol{A}$ 是 $n$ 阶方阵，如果对任何非零向量 $\boldsymbol{z}$ ，都有 $\boldsymbol{z}^T\boldsymbol{Az} >0$ ，就称 $\boldsymbol{A}$ 为正定矩阵。
（2）狭义定义：一个 $n$ 阶的实对称矩阵 $\boldsymbol{A}$ 是正定的的条件是当且仅当对于所有的非零实系数向量 $\boldsymbol{z}$ ，都有 $\boldsymbol{z}^T\boldsymbol{Az} >0$ 。

4 矩阵的等价

如果矩阵 $\boldsymbol{A}$ 经有限次初等变换变成矩阵 $\boldsymbol{B}$ ，就称矩阵 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 等价。等价描述的是一种关系，满足反身性对称性以及传递性。矩阵常见的等价关系有三个，相抵，相似以及合同。相抵是一种比较弱的等价关系；相似关系是比较强的等价关系；合同关系是另一种等价关系。

4.1 矩阵的相抵

1. 定义
        设 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 都是 $\times n$ 阶矩阵，如果存在非奇异的 $m$ 阶方阵 $\boldsymbol{D}$ 和 $n$ 阶方阵 $\boldsymbol{C}$ ，使
$\boldsymbol{B}=\boldsymbol{DAC}\tag{4-1}$
        成立，则称矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是相抵的，记为 $\boldsymbol{A} \simeq \boldsymbol{B}$ 。
        相抵关系在几何上的解释：在两个不同维的线性空间 $V^n$ 和 $V^m$ 中，同一个线性算子 $\mathscr{A}$ 在不同基所对应的矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 之间的关系。
2. 定理

定理一：相抵矩阵具有相同的秩。

4.2 矩阵的相似

1. 定义
        如果 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 是数域 $K$ 上的两个 $n$ 阶方阵，如果存在非奇异的 $n$ 阶方阵 $\boldsymbol{C}$ ，使得
$\boldsymbol{B}=\boldsymbol{C}^{-1}\boldsymbol{AC} \tag{4-2}$
        成立，则称矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是相似的，记为 $\boldsymbol{A} \sim \boldsymbol{B}$ 。
        几何解释：同一线性变换在不同基下的矩阵是相似的；反之。如果两个矩阵相似，它们可以看做是同一个线性变换在两个不同基下的矩阵。

2. 定理

定理一：相似矩阵具有反身性，对称性与传递性。
定理二：相似矩阵有相同的迹。
定理三：相似矩阵有相同的特征多项式，特征值，行列式、秩。
定理四：相似矩阵有相同的最小多项式。

4.3 矩阵的合同

1. 定义
设 $\boldsymbol{A}$ 与 $\boldsymbol{B}$ 是两个 $n$ 阶方阵，如果存在非奇异的 $n$ 阶方阵 $\boldsymbol{C}$ ，使得
$\boldsymbol{B}=\boldsymbol{C}^T\boldsymbol{AC} \tag{4-3}$
成立，则称矩阵 $\boldsymbol{A}$ 和 $\boldsymbol{B}$ 是相合（或合同）的。

2. 定理

定理一：合同矩阵具有反身性，对称性与传递性。
定理二：合同矩阵有相同的秩、正负惯性指数。
定理三：与对称矩阵合同的矩阵是对称矩阵.
定理四：数域 $K$ 上任一对称矩阵都合同于一个对角矩阵。

小结：
总之，相抵、相似、合同反映了两矩阵之间的三种内在联系，这三种关系是既有区别又有联系的，相似与合同只不过是相抵的特殊情况，而且相似与合同只有在 $\boldsymbol{C}^{T}=\boldsymbol{C}^{-1}$ 时（即 $\boldsymbol{C}$ 为正交阵）才一致。

$\boldsymbol{A}$ 与 $\boldsymbol{B}$ 相抵 $\Longleftrightarrow \boldsymbol{PAQ} = \boldsymbol{B}(\boldsymbol{P, Q}可逆)$ ：

$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A}$ 可经由初等变换化为 $\boldsymbol{B}$

$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与\boldsymbol{B}$ 同型且同秩

$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A}与 \boldsymbol{B}$ 有相同的相抵标准形

$\boldsymbol{A}$ 与 $\boldsymbol{B}$ 相似 $\Longleftrightarrow \boldsymbol{P}^{-1}\boldsymbol{AP} = \boldsymbol{B}(\boldsymbol{P}可逆)$ ：

$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与 \boldsymbol{B}$ 有相同的秩、特征多项式、特征值、行列式

$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{B}$ 矩阵可对角化

$\boldsymbol{A}$ 与 $\boldsymbol{B}$ 合同 $\Longleftrightarrow \boldsymbol{P}^{T}\boldsymbol{AP} = \boldsymbol{B}(\boldsymbol{P}可逆)$ ：
$\qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与 \boldsymbol{B}$ 有相同的秩、正负惯性指数