矩阵论——线性空间与线性映射

最新推荐文章于 2023-10-14 21:34:39 发布

楠兮兮

最新推荐文章于 2023-10-14 21:34:39 发布

阅读量1.3k

点赞数 1

分类专栏：数学文章标签：矩阵

本文链接：https://blog.csdn.net/X1009190387/article/details/104602114

版权

数学专栏收录该内容

12 篇文章 1 订阅

订阅专栏

一、线性空间
给定非空集合 $\bm{V}$ 和域 $\bm{F}$ ，若存在映射
$\begin{aligned} & \bm{σ} : \bm{V} × \bm{V} \rightarrow \bm{V}\\ & \ \ \ \ \ \ (V_1, V_2)\mapsto\bm{σ}(V_1, V_2) \end{aligned}$ 则称 $\bm{σ}$ 为 $\bm{V}$ 上的加法。
其中 $\bm{V} × \bm{V}$ 的运算称为集合的卡氏积【Cartesian product】，又名笛卡尔积，形如 $\bm{S_1} × \bm{S_2} = \{(s_1, s_2)|s_1\in \bm{S_1},s_2\in \bm{ S_2}\}$ 这些有序对的全体构成了新的集合，称为其卡氏积。
在一个运算系统中，如果该系统是封闭的，则称该系统为一个域。典型的有有理数域，实数域与复数域，而自然数等集合无法完全进行基本运算，并非封闭，不能成为域。
先回顾通常的运算规则，包括加法的交换律 $v_1 + v_2 = v_2 + v_1$ 加法的结合律 $v_1 + v_2) + v_3 = v_1 + (v_2 + v_3)$ 加法的有零元 $\exists e\in \bm{V}, e + v = v$ 加法的有负元 $\forall v\in \bm{V}, \exists a\in \bm{V}, v + a = e$ 记 $a = - v$ 。以及数乘法的向量与数分配律 $v_1 + v_2)k = v_1k + v_2k$ $v(k_1 + k_2) = vk_1 + vk_2$ 数乘法的结合律 $v (k l) = (v k) l$ 其中 $k$ 与 $l$ 是域 $\bm{F}$ 的任意数。乘法的1元 $v 1 = v$ 其中在数乘中，若向量为列向量，数乘法的数写在右侧；反之亦然，如此这般可以将数化为1×1的向量，由此等效为矩阵乘法。
给定非空集合 $\bm{V}$ 和域 $\bm{F}$ ，在集合 $\bm{V}$ 的元素之间定义加法与数乘法，若满足以上四条加法法则与四条数乘法法则，则称集合 $\bm{V}$ 为域 $\bm{F}$ 的线性空间。
将几何空间作为线性空间，来理解线性空间。定义 $\bm{V}$ 为有向线段的全体， $\bm{F}$ 为实数域，考察加法为平行四边形法则，数乘法为正反向伸缩，并考察八条运算规律。
再考虑函数空间，以一定区间 $X$ 为定义域，具有n个分量的n维向量值函数，将该向量作为一个元素，则所有这些函数的集合称为函数空间，记 $\bm{R}^n) = \{ \bm{f}|\bm{f} = [f_1(x), ..., f_n(x)]^T, x\in X \}$ 并考虑向量加法与数乘法，以考察八条运算规则。

二、向量空间与线性相关性
定义向量组，由p个元素排列组成的有限序列 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 及向量组运算得到的抽象矩阵 $\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right )$ ，并定义若 $\exists \bm{k} = [k_1, k_2 , ..., k_p]^T \ne \bm{0}, \bm{k} \in \bm{F}^p$ ，使得 $\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{0}$ 则称向量组 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 为线性相关；若向量组 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 不是线性相关的，则成为线性无关。再考虑线性相关性的矩阵描述，即方程组 $\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{0}$ 当向量组 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 线性相关时，该方程组有非零解；反之，则仅有零解。
考虑两个向量组 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 与 $\bm{b_1}, \bm{b_2}, ..., \bm{b_q}$ ，以及向量 $\bm{b}$ ，若 $\exists \bm{k} = [k_1, k_2 , ..., k_p]^T, \bm{k} \in \bm{F}^p$ ，使得 $\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{b}$ 则称 $\bm{b}$ 可由 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 线性表示。而每个 $\bm{b_i}$ 都可以由 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 线性表示，则称 $\bm{b_1}, \bm{b_2}, ..., \bm{b_q}$ 可由 $\bm{a_1}, \bm{a_2}, ..., \bm{a_p}$ 线性表示。矩阵表示为 $\left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{b}$ 当 $\bm{b}$ 可由 $\bm{a_i}$ 线性表示时，该非齐次线性方程组有解。同样，向量组之间的线性关系由矩阵表示为 $\bm{A}\bm{X}_{p×q} = \bm{B}$ 当向量组之间线性相关时，该矩阵方程组有解。
线性表示关系具有传递性。考虑三个向量组 $\{\bm{a_i}\}, \{\bm{b_j}\}, \{\bm{c_k}\}$ ，记当 $\bm{A}$ 可由 $\bm{B}$ 组合为 $\bm{A} \le_{lin} \bm{B}$ 则有若 $\bm{b_j} \le_{lin} \bm{a_i}, \bm{c_k} \le_{lin} \bm{b_j}$ ，则 $\bm{c_k} \le_{lin} \bm{a_i}$ ，其矩阵方程的表示为 $\bm{A}\bm{X} = \bm{B} \\ \bm{B}\bm{Y} = \bm{C}$ 有解，则 $\bm{A}\bm{Z} = \bm{C}$ 自然有解 $\bm{Z} = \bm{X}\bm{Y}$ 从母序列中挑出一个子序列构成向量组，这个子序列构成的向量组为原来母序列的子组。取 $\{\bm{a_i}\}$ 的子组 $\{\bm{b_j}\}$ ，若 $\{\bm{b_j}\}$ 线性无关，且当满足 $\{\bm{a_i}\}$ 的子组 $\{\bm{c_k}\}$ ， $\{\bm{b_j}\}$ 也是 $\{\bm{c_k}\}$ 的子组时，若对于 $s < t$ ，其中 $s, t$ 是两向量组 $\{\bm{b_j}\}$ ， $\{\bm{c_k}\}$ 的维度，都有 $\{\bm{c_k}\}$ 线性相关，则此时称 $\{\bm{b_j}\}$ 为 $\{\bm{a_i}\}$ 的最大无关组。母组可由其极大线性无关组线性表示。极大线性无关组具有无关性与表示性，即组向量之间线性无关，并且母序列的任意向量组可由极大线性无关组线性表示。
极大线性无关组的向量是不唯一的，但向量数是唯一的。考虑母序列 $\bm{A} = \{\bm{a_i}\}$ 的极大线性无关组 $\bm{B} = \{\bm{b_j}\}$ 与 $\bm{C} = \{\bm{c_k}\}$ ，其维度分别为 $s, t$ ，有 $\bm{B}\bm{X} = \bm{A} \\ \bm{A}\bm{Y} = \bm{C}$ 有解，于是 $\bm{B}\bm{Z} = \bm{C}$ 有解，解为 $\bm{Z}_{s×t}$ ，考虑严格的 $s < t$ ，则 $\bm{Z}_{s×t}$ 可以看成不定方程，即方程数小于未知数个数的方程的系数矩阵。而易证不定方程有无数的非零解。考虑矩阵方程 $\bm{Z}\bm{W} = \bm{0}$ 显然，该方程有非零解。带入上述方程，有 $\bm{B}\bm{Z}\bm{W} = \bm{C}\bm{W}$ 可以得到 $\bm{C}\bm{W} = \bm{0}$ 有非零解。然而 $\bm{C} = \{\bm{c_k}\}$ 是一个线性无关组， $\bm{C}\bm{W} = \bm{0}$ 不存在非零解，故矛盾，而 $s > t$ 亦然，证毕。
向量组的极大线性无关组所含向量的个数称为向量组的秩【Rank】。秩是向量组的内在性质，不随极大线性无关组的选择而改变。

三、基与坐标
取域 $\bm{F}$ 上的线性空间 $\bm{V}$ ，如果有正整数 $\bm{N}$ 及 $\bm{V}$ 中的向量组 $\bm{A} = \{\bm{a_i}\}$ ，使得 $\bm{A}$ 线性无关，并且 $\forall \bm{a} \in \bm{V}$ 都可以由 $\{\bm{a_i}\}$ 线性表示，即 $\bm{a} = \bm{A}_{n×n}\bm{k}_{n×1}$ 则称 $\bm{V}$ 是n维线性空间。则 $\{\bm{a_i}\}$ 称为 $\bm{V}$ 的一个基向量。而 $\bm{k} \in \bm{F}^n$ 称为 $\bm{a} \in \bm{V}$ 沿着该基的坐标向量。一个空间的不同基向量的个数是相同的，因为基都是该空间的极大线性无关组，即空间的维度是固定的。
基或坐标系实现了抽象线性空间到标准线性空间之间的一一对应，即 $\forall τ:S_1\rightarrow S_2$ ， $\exists ρ:S_2\rightarrow S_1$ ，使得 $τ ρ$ 是 $S_1$ 的恒等映射，而 $ρ τ$ 是 $S_2$ 的恒等映射。这就认为这两个抽象集合是重构的。
考虑n维空间 $\bm{V}$ 的基 $\{\bm{a_i}\}$ ，与该基下的坐标 $\bm{k}$ ，则抽象空间 $\bm{V}$ 与标准线性空间 $\bm{F}^n$ 的映射关系，即 $\bm{v} \in \bm{V}$ 可以映射为 $\bm{k}$ 。 $\forall \bm{k} \in \bm{F}^n$ ，其在 $\bm{V}$ 的映射为 $\bm{v} = \bm{a}\bm{k} = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T$ ；对应的，若 $\bm{v}$ 与 $\bm{v}'$ 的映射均为 $\bm{k}$ ，则有 $\bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T$ ，由于线性无关性，有 $[\bm{a}_1, ..., \bm{a}_n][k_1'-k_1, ..., k_n'-k_n]^T = 0$ ，故 $\bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^T$ ，即 $\bm{v} = \bm{v}'$ 。
标准线性空间的基称为标准基，标准基组成的基矩阵称为单位矩阵，单位矩阵的列向量组是标准基向量组。再考虑任意的线性空间的基。所谓基者，就是一个无关向量组。对于n维空间，其秩为n，即线性无关。而对于表示性，即对任意的线性无关向量组 $\bm{A}$ ， $\bm{A}\bm{x} = \bm{b}$ 一定有解，这显然成立。而该方程组亦可以看作 $\bm{b}$ 沿着基向量 $\bm{A}$ 展开的问题。
考虑理解无限维空间，定义 $F_n[x]$ 是以x为未知项的小于n次的多项式的函数空间，则 $F_n[x]$ 的维度为n，其基为 $1, x, ..., x^{n-1}]$ ，其中 $\in F_n[x]$ ，是一个函数。则任意多项式可以由该基表示。其线性无关性，考虑证明 $1, ..., x^{n-1}][a_1, ..., a_n]^T = 0$ ，则 $a_i=0$ 。其中 $\in F_n[x]$ 。分别令 $x = 1, 2, . . ., n$ ，对于 $x^0, ..., x^{n-1}][a_1, ..., a_n]^T = 0$ ，有 $\left( \begin{matrix}1^0 & 1^1 & ... & 1^{n-1} \\ 2^0 & 2^1 & ... & 2^{n-1} \\... & & & \\n^0 & n^1 & ... & n^{n-1} \end{matrix} \right )\left( \begin{matrix}a_1 \\ a_2 \\...\\a_{n} \end{matrix} \right ) = \left( \begin{matrix} 0 \\ 0 \\...\\ 0 \end{matrix} \right )$ 考虑范德蒙行列式，则 $a_i=0$ 。而考虑 $F_\infty[x]$ ，其不是有限维的，任意有限个向量都不是其基。考虑n维基与n次项，考虑表示性，有 $x^0, ..., x^{n-1}][a_1, ..., a_n]^T = x^{n}$ ，即 $x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, -1]^T = 0$ ，再考虑无关性，有 $x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, a_{n+1}]^T = 0$ ，得到解为 $a_{n+1} = -1$ ，这与线性无关组的条件 $a_i = 0$ 矛盾，显然不是线性无关组。于是该n维不是一个基，即没有有限维基，即该空间不是一个有限维空间。

四、子空间
考虑线性空间 $\bm{V}$ ，以及 $\bm{V}$ 的非空子集 $\bm{W}$ ，其对加法封闭，即 $\forall a,b \in \bm{W}, a+b \in \bm{W}$ ；以及对数乘法封闭， $\forall a \in \bm{W}, \forall k \in \bm{R}， ka \in \bm{W}$ ，则称 $\bm{W}$ 是 $\bm{V}$ 的子空间。 $\bm{W}$ 也是线性空间。
考虑线性空间 $\bm{V}$ ，取向量组为 $\{\bm{a}_p\}$ ，取集合 $span\{\bm{a}_p\} = \{\bm{a}_1c_1 + ... +\bm{a}_pc_p|c_i \in \bm{F}\}$ ，则 $span\{\bm{a}_p\}$ 是 $\bm{V}$ 的一个子空间，并称为 $\{\bm{a}_p\}$ 的生成子空间。反而言之，对于 $\bm{V}$ 的子空间 $\bm{W}$ 与 $\{\bm{a}_p\}$ ，有 $\bm{W} = span\{\bm{a}_p\}$ ，则 $\{\bm{a}_p\}$ 是 $\bm{W}$ 的一个生成组。生成组提供了子空间的一种表现方式。
考虑矩阵 $\bm{A} \in \bm{R}^{m×n}$ ，则 $\{\bm{x}|\bm{A}\bm{x} = \bm{0}, \bm{x}\in \bm{F}^n\}$ 是 $\bm{F}^n$ 的子空间，其封闭性易证。即齐次方程组的解集合是 $\bm{F}^n$ 的子空间。定义 $\bm{A} = \{\bm{x}|\bm{A}\bm{x} = \bm{0},\bm{x}\in \bm{F}^n\}$ ，称为 $\bm{A}$ 的核，用来代表以 $\bm{A}$ 为系数矩阵的线性方程组的解空间。再考虑 $\{\bm{A}\bm{x}|\bm{x}\in \bm{F}^n\}$ ，其是 $\bm{F}^m$ 的子空间。定义 $\bm{A}$ ，称为 $\bm{A}$ 的像，表示 $\bm{A}$ 的列向量组以 $\bm{x}$ 为系数的线性组合，即 $\bm{A}$ 的列向量组的生成子空间。
考虑线性空间 $\bm{V}$ 的子空间 $\bm{W}$ 与 $\bm{U}$ ，则 $\bm{W}$ 与 $\bm{U}$ 的交集也是子空间， $\bm{W}$ 与 $\bm{U}$ 的和也是子空间。

五、线性映射
$\bm{V_1}$ 和 $\bm{V_2}$ 时 $\bm{R}$ 上的线性空间，对于映射 $σ:\bm{V_1}\rightarrow\bm{V_2}$ ，若有 $σ(\bm{e}_1 + \bm{e}_2) = σ(\bm{e}_1) + σ(\bm{e}_2)$ 的保加性，与 $σ(\bm{e}k) = kσ(\bm{e})$ 的保数乘性，则称该映射为 $\bm{V_1}$ 到 $\bm{V_2}$ 的线性映射。当 $\bm{V_1} = \bm{V_2} = \bm{V}$ 时，则称为 $\bm{V}$ 上的线性变换。
若线性映射 $σ$ 是可逆映射，则称 $σ$ 为线性同构。即任一元素存在像且像唯一，任一像都有原像且原像唯一，则该两个线性空间的结构完全相同。有限维的线性空间即与同维的标准线性空间同构。
考虑矩阵与标准线性空间之间的线性映射，两者之间的等同性，即取矩阵 $\bm{A}\in\bm{F}^{m×n}$ ，则线性映射可表示为 $\begin{aligned} \bm{A}:&\bm{F}^{n}\rightarrow\bm{F}^{m} \\ &\bm{x} \mapsto\bm{y} = \bm{A}\bm{x}\end{aligned}$ 反之，记 $\bm{F}^{n}$ 的标准基 $\bm{e}_1, ..., \bm{e}_n$ ，则对于线性映射 $\bm{A}$ ，考虑矩阵 $\bm{A} = (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))$ ，则任取 $\bm{x} \in \bm{F}^n$ ，有 $\begin{aligned} \bm{x} &= \bm{I}\bm{x} \\ &= \bm{e}_1x_1 + ... + \bm{e}_nx_n \end{aligned}$ 则 $\bm{x}$ 的映射 $\begin{aligned} \bm{A}(\bm{x}) &= \bm{A}(\bm{e}_1x_1) + ... + \bm{A}(\bm{e}_nx_n) \\ &= x_1\bm{A}(\bm{e}_1) + ... + x_n\bm{A}(\bm{e}_n) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= \bm{A}\bm{x} \end{aligned}$ 即任一抽象的线性映射都可由矩阵实现。
再考虑线性映射的矩阵表示，给定线性映射 $\bm{A}:\bm{V}\rightarrow\bm{W},dim(\bm{V}) = n, dim(\bm{W}) = m$ 取 $\bm{V}$ 的基 $\bm{e}_1, ..., \bm{e}_n$ ，称其为入口基；与 $\bm{W}$ 的基 $\bm{η}_1, ..., \bm{η}_m$ ，称为出口基。记第j个入口基向量 $\bm{e}_j$ 的像 $\bm{A}(\bm{e}_j)$ 在出口基下的坐标为 $a_{1j}, ...,a_{mj})^T$ ，则 $\bm{A}(\bm{e}_j) = (\bm{η}_1, ..., \bm{η}_m)(a_{1j}, ...,a_{mj})^T$ 共考虑n个原像向量，则 $\bm{A} = \left( \begin{matrix}a_{11} & ... & a_{1n} \\ ...&&...\\a_{m1} &...& a_{mn} \end{matrix} \right )$ 则称矩阵 $\bm{A}$ 为映射 $\bm{A}$ 的矩阵表示，有 $\bm{A}((\bm{e}_1, ..., \bm{e}_n)) = (\bm{η}_1, ..., \bm{η}_m)\bm{A}$ 对于入口基坐标下的 $\bm{x}$ ，其映射在出口基的坐标为 $\bm{A}\bm{x}$ ，即 $\begin{aligned} \bm{A}(\bm{x}) &= \bm{A}((\bm{e}_1, ..., \bm{e}_n)\bm{x}) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= (\bm{η}_1, ..., \bm{η}_m)\bm{A}\bm{x} \\&= (\bm{η}_1, ..., \bm{η}_m)(\bm{A}\bm{x}) \end{aligned}$ 考虑矩阵分析表示几何空间的旋转，其角度为 $θ$ ，其出口基与入口基均是3维空间，将轴的正向定义为 $\bm{e}_3$ ，其他为 $\bm{e}_1, \bm{e}_2$ ，则旋转映射 $\bm{B} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}cos(θ) & -sin(θ) & 0 \\ sin(θ) & cos(θ) & 0 \\0 &0& 1 \end{matrix} \right )$ 考虑矩阵论表示几何空间的反射，将镜面的正法向定义为 $\bm{e}_3$ ，其他为 $\bm{e}_1, \bm{e}_2$ ，则镜面映射 $\bm{C} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}1 & 0 & 0 \\ 0 & 1 & 0 \\0 &0& -1 \end{matrix} \right )$

六、矩阵等价与相似
对于 $\bm{A}, \bm{B}\in\bm{F}^{m×n}$ ，存在可逆矩阵 $\bm{P}\in\bm{F}^{n×n}$ 与 $\bm{Q}\in\bm{F}^{m×m}$ ，使得 $\bm{A}\bm{P}=\bm{Q}\bm{B}$ 则称 $\bm{A}$ 与 $\bm{B}$ 等价。在线性代数中，等价描述为 $\bm{T}\bm{A}\bm{S}=\bm{B}$ ，以刻画初等行列变换，即 $\bm{A}$ 可由初等变换得到 $\bm{B}$ 。而从矩阵分析考虑，有 $\bm{A}(\bm{P}_1, ...,\bm{P}_n) = (\bm{Q}_1, ...,\bm{Q}_m)\bm{B}$ 将矩阵 $\bm{A}$ 视为线性映射 $\bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}$ ，满秩矩阵 $\bm{P}$ 的列向量为n维空间的一般基，满秩矩阵 $\bm{Q}$ 的列向量为m维空间的一般基，则有线性映射 $\bm{A}$ 在入口基 $\bm{P}$ 与出口基 $\bm{Q}$ 下的矩阵表示是 $\bm{B}$ 。
考虑选择基以最简表示，即 $\bm{A}\bm{P} = \bm{Q}\left( \begin{matrix}\bm{I}_r & \bm{0} \\ \bm{0} & \bm{0} \end{matrix} \right )$ 有 $\bm{A}\bm{P}_1 = \bm{Q_1} \\ ... \\ \bm{A}\bm{P}_r = \bm{Q_r} \\ \bm{A}\bm{P}_{r+1} = \bm{0}\\... \\ \bm{A}\bm{P}_n = \bm{0}$ 在标准基 $\bm{I}_n$ 与 $\bm{I}_m$ 下， $\bm{A}:\bm{x} \mapsto \bm{y} = \bm{Ax}$ ；但在基 $\bm{P}$ 与 $\bm{Q}$ 下， $\bm{B}:\bm{x}' \mapsto \bm{y}' = \bm{Bx}'$ ，其中 $\bm{B}$ 是最简表示，则有 $\bm{y}'_1 =\bm{x}'_1\\ ...\\ \bm{y}'_r =\bm{x}'_r\\ \bm{y}'_{r+1} = \bm{0}\\ ...\\ \bm{y}'_{m} = \bm{0}$ 使得分量完全解耦。
对于 $\bm{A}, \bm{B}\in\bm{F}^{n×n}$ ，若存在n阶可逆矩阵 $\bm{P}$ 使得 $\bm{AP} = \bm{PB}$ 则称 $\bm{A}$ 与 $\bm{B}$ 相似。将矩阵 $\bm{A}$ 视为线性变换 $\bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}$ ，满秩矩阵 $\bm{P}$ 的列向量为n维空间的一般基，则有线性变换 $\bm{A}$ 在入口基与出口基 $\bm{P}$ 下的矩阵表示是 $\bm{B}$ 。
首先定义方阵的不变子空间，若 $\bm{A}\in\bm{F}^{n×n}$ ， $\bm{W}\in\bm{F}^n$ 是 $\bm{F}^n$ 的子空间，若 $\bm{A}(\bm{W}) \subseteq \bm{W}$ ，则称 $\bm{W}$ 是 $\bm{A}$ 的不变子空间。
考虑不变子空间与相似最简化的等价性，对于 $\bm{AP} = \bm{PB}$ ，令 $\bm{P} = (\bm{P}_1, \bm{P}_2)$ ，相应的， $\bm{B} = \left( \begin{matrix}\bm{B}_{11} & \bm{B}_{12} \\ \bm{B}_{21} & \bm{B}_{22} \end{matrix} \right )$ 有 $\bm{B}_{21} = \bm{0}$ ，则 $im\bm{P}_1$ 是 $\bm{A}$ 的不变子空间，而 $\bm{B}_{12} = \bm{0}$ ，则 $im\bm{P}_2$ 是 $\bm{A}$ 的不变子空间。证明如下 $\bm{AP}_1 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{11}, \bm{B}_{21})^T \\ \bm{AP}_2 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{12}, \bm{B}_{22})^T$ 要证， $im\bm{P}_1$ 是 $\bm{A}$ 的不变子空间，则 $\bm{A}im\bm{P}_1 \subseteq im\bm{P}_1$ ，其中 $\bm{P}_1$ 是 $\bm{P}_1$ 列向量的线性组合。当 $\bm{B}_{21} = \bm{0}$ ，有 $\bm{AP}_1 = (\bm{p}_1, ... , \bm{p}_n)\bm{B}= \bm{P}_1\bm{B}, \bm{Ap}_j \in im \bm{P}_1, j = 1, ..., n$ 显然成立。 $\bm{B}_{12} = \bm{0}$ 同理。
反之，若有不变子空间，就一定有可以三角化的矩阵。考虑 $\bm{A}$ 的不变子空间 $\bm{W} = span\{\bm{v}_1, ... , \bm{v}_t\}$ ，则有可逆矩阵 $\bm{P}$ 使得 $\bm{A}$ 三角化为 $\bm{B}$ ，即 $\bm{P}_1 = (\bm{v}_1, ... , \bm{v}_t), \bm{P}_2 = (\bm{u}_1, ... , \bm{u}_{n - t})$ 记 $\bm{P} = (\bm{P}_1, \bm{P}_2)$ ，则 $\bm{A}\bm{P}$ 就是一个三角矩阵。其中 $\bm{P}_2$ 是一个扩充矩阵，其使得 $\bm{P}$ 是一个可逆方阵。
考虑相似对角化的条件。取 $\bm{AP} = \bm{PΛ}$ ，则 $\bm{P}$ 的每一维度向量张成的空间 $im\bm{p}_j$ 都是 $\bm{A}$ 的不变子空间。由此，定义特征值与特征向量，考虑 $\bm{Ap} = \bm{p}λ$ ，则称 $λ$ 是矩阵的一个特征值，而 $\bm{p}$ 是其相应的一个特征向量。其意义为一维不变子空间的映射仍在该子空间，即一维向量的线性组合。那么， $\bm{P}$ 的每一维度向量张成的空间 $im\bm{p}_j$ 都是 $\bm{A}$ 的不变子空间，等效为 $\bm{A}$ 可以相似，等价于存在有n个线性无关的向量。