MIT 线性代数（19—21）读书笔记

最新推荐文章于 2024-07-20 18:00:14 发布

Paul-Huang

最新推荐文章于 2024-07-20 18:00:14 发布

阅读量2.6k

点赞数 3

分类专栏： MIT 线性代数读书笔记文章标签：读书笔记麻省理工线性代数

本文链接：https://blog.csdn.net/huang1024rui/article/details/69681170

版权

MIT 线性代数读书笔记专栏收录该内容

13 篇文章 46 订阅

订阅专栏

第十九讲行列式公式和代数余子式

1.行列式公式

上一讲中，我们从三个简单的性质扩展出了一些很好的推论，本讲将继续使用这三条基本性质：

$\det I=1$ ；
交换行行列式变号；
对行列式的每一行都可以单独使用线性运算，其值不变。

我们使用这三条性质推导二阶方阵行列式：

∣ ∣ ∣ a c b d ∣ ∣ ∣ = ∣ ∣ ∣ a c 0 d ∣ ∣ ∣ + ∣ ∣ ∣ 0 c b d ∣ ∣ ∣ = ∣ ∣ ∣ a c 00 ∣ ∣ ∣ + ∣ ∣ ∣ a 0 0 d ∣ ∣ ∣ + ∣ ∣ ∣ 0 c b 0 ∣ ∣ ∣ + ∣ ∣ ∣ 00 b d ∣ ∣ ∣ = a d - b c

$\begin{vmatrix}a& b\\c& d\end{vmatrix}=\begin{vmatrix}a& 0\\c& d\end{vmatrix}+\begin{vmatrix}0& b\\c& d\end{vmatrix}=\begin{vmatrix}a& 0\\c& 0\end{vmatrix}+\begin{vmatrix}a& 0\\0& d\end{vmatrix}+\begin{vmatrix}0& b\\c& 0\end{vmatrix}+\begin{vmatrix}0& b\\0& d\end{vmatrix}=ad-bc$

按照这个方法，我们继续计算三阶方阵的行列式，可以想到，我们保持第二、三行不变，将第一行拆分为个行列式之和，再将每一部分的第二行拆分为三部分，这样就得到九个行列式，再接着拆分这九个行列式的第三行，最终得到二十七个行列式。可以想象到，这些矩阵中有很多值为零的行列式，我们只需要找到不为零的行列式，求和即可。

∣ ∣ ∣ ∣ a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33 ∣ ∣ ∣ ∣ = ∣ ∣ ∣ ∣ a 11 00 0 a 22 0 00 a 33 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ a 11 00 00 a 32 0 a 23 0 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 0 a 21 0 a 12 00 00 a 33 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 00 a 31 a 12 00 0 a 23 0 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 0 a 21 0 00 a 32 a 13 00 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 00 a 31 0 a 22 0 a 13 00 ∣ ∣ ∣ ∣

$\begin{vmatrix}a_{11}& a_{12}& a_{13}\\a_{21}& a_{22}& a_{23}\\a_{31}& a_{32}& a_{33}\end{vmatrix}=\begin{vmatrix}a_{11}& 0& 0\\0& a_{22}& 0\\0& 0& a_{33}\end{vmatrix}+\begin{vmatrix}a_{11}& 0& 0\\0& 0& a_{23}\\0& a_{32}& 0\end{vmatrix}+\begin{vmatrix}0& a_{12}& 0\\a_{21}& 0& 0\\0& 0& a_{33}\end{vmatrix}+\begin{vmatrix}0& a_{12}& 0\\0& 0& a_{23}\\a_{31}& 0& 0\end{vmatrix} +\begin{vmatrix}0& 0& a_{13}\\a_{21}& 0& 0\\0& a_{32}& 0\end{vmatrix}+\begin{vmatrix}0& 0& a_{13}\\0& a_{22}& 0\\a_{31}& 0& 0\end{vmatrix}$

原 式 = a 11 a 22 a 33 - a 11 a 23 a 32 - a 12 a 21 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 - a 13 a 22 a 31 (1)

$原式=a_{11}a_{22}a_{33}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{13}a_{22}a_{31} \tag{1}$

同理，我们想继续推导出阶数更高的式子，按照上面的式子可知 $n$ 阶行列式应该可以分解成 $n!$ 个非零行列式（占据第一行的元素有 $n$ 种选择，占据第二行的元素有 $n-1$ 种选择，以此类推得 $n!$ ）：

det A = \sum n! \pm a 1 α a 2 β a 3 γ \dots a n ω, (α, β, γ, ω) = P n n (2)

$\det A=\sum_{n!} \pm a_{1\alpha}a_{2\beta}a_{3\gamma}\cdots a_{n\omega}, (\alpha, \beta, \gamma, \omega)=P_n^n\tag{2}$

这个公式还不完全，接下来需要考虑如何确定符号：

∣ ∣ ∣ ∣ ∣ ∣ ∣ 00 1 ¯ 1 - 0 1 ¯ 1 - 0 1 ¯ 1 - 00 1 - 00 1 ¯ ∣ ∣ ∣ ∣ ∣ ∣ ∣

$\begin{vmatrix}0& 0& \overline 1& \underline 1\\0& \overline 1& \underline 1& 0\\\overline 1& \underline 1& 0& 0\\\underline 1& 0& 0& \overline 1\end{vmatrix}$

如上图矩阵所示：

观察带有下划线的元素，它们的排列是 $(4,3,2,1)$ ，变为 $(1,2,3,4)$ 需要两步操作，所以应取 $+$ 正；

观察带有上划线的元素，它们的排列是 $(3,2,1,4)$ ，变为 $(1,2,3,4)$ 需要一步操作，所以应取 $-$ 负。

观察其他元素，我们无法找出除了上面两种以外的排列方式，于是该行列式值为零，这是一个奇异矩阵。

即 $\color{red}{正负号的选取}$ 可以是：用逆序数判断，即我们把全排列的顺序写出来，比如第一行我们选了第2列，第二行选第3列，第三行选第1列，那么序列就是231，逆序数就是从左到右遍历每一个数，统计右侧有几个数比自己小，这里231，2之后有一个，3之后也有一个，共二个，称此为偶排列，奇数次则为奇排列。偶排列时取正号，奇排列取负，原理在于对一个排列做一次交换后奇排列变偶排列，偶排列变奇排列，而123456…n是偶排列，必须为加。

2.代数余子式 cofactors

此处引入代数余子式（cofactor）的概念，它的作用是把 $n$ 阶行列式化简为 $n-1$ 阶行列式。

于是我们把 $(1)$ 式改写为：

a 11 (a 22 a 33 - a 23 a 32) + a 12 (a 21 a 33 - a 23 a 31) + a 13 (a 21 a 32 - a 22 a 31)

$a_{11}(a_{22}a_{33}-a_{23}a_{32})+a_{12}(a_{21}a_{33}-a_{23}a_{31})+a_{13}(a_{21}a_{32}-a_{22}a_{31})$

∣ ∣ ∣ ∣ a 11 00 0 a 22 a 32 0 a 23 a 33 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 0 a 21 a 31 a 12 00 0 a 23 a 33 ∣ ∣ ∣ ∣ + ∣ ∣ ∣ ∣ 0 a 21 a 31 0 a 22 a 32 a 13 00 ∣ ∣ ∣ ∣

$\begin{vmatrix}a_{11}& 0& 0\\0& a_{22}& a_{23}\\0& a_{32}& a_{33}\end{vmatrix}+\begin{vmatrix}0& a_{12}& 0\\a_{21}& 0& a_{23}\\a_{31}& 0& a_{33}\end{vmatrix}+\begin{vmatrix}0& 0& a_{13}\\a_{21}& a_{22}& 0\\a_{31}& a_{32}& 0\end{vmatrix}$

于是，我们可以定义 $a_{ij}$ 的代数余子式：将原行列式的第 $i$ 行与第 $j$ 列抹去后得到的 $n-1$ 阶行列式记为 $C_{ij}$ ， $\color{red}{i+j为偶时时取+，i+j为奇时取-}$ 。

现在再来完善式子 $(2)$ ：将行列式 $A$ 沿第一行展开：

det A = a 11 C 11 + a 12 C 12 + \dots + a 1 n C 1 n

$\det A=a_{11}C_{11}+a_{12}C_{12}+\cdots+a_{1n}C_{1n}$

到现在为止，我们了解了 $\color{red}{三种求行列式的方法}$ ：

$\color{red}{消元，\det A就是主元的乘积}$ ；
$\color{red}{使用(2)式展开，求n!项之积}$ ；
$\color{red}{使用代数余子式}$ 。

对于矩阵行列式的计算，消元的得到主元是一个很好的方法，与之相比行列式的展开公式较为复杂，而代数余子式的方法介于两者之间，它的核心想法是通过降阶来将原来的行列式展开成更简单的行列式。

计算例题： $A_4=\begin{vmatrix}1& 1& 0& 0\\1& 1& 1& 0\\0& 1& 1& 1\\0& 0& 1& 1\end{vmatrix}\stackrel{沿第一行展开}{=}\begin{vmatrix}1& 1& 0\\1& 1& 1\\0& 1& 1\end{vmatrix}-\begin{vmatrix}1& 1& 0\\0& 1& 1\\0& 1& 1\end{vmatrix}=-1-0=-1$

可观察出周期为6：
这里写图片描述

3.总结

1.行列式展开的正负号；
2.计算行列式的三种方法；
3.代数余子式求解时的正负号。

第二十讲：克拉默法则、逆矩阵、体积

本讲主要介绍逆矩阵的应用。

1.求逆矩阵

我们从逆矩阵开始，对于二阶矩阵有 $\begin{bmatrix}a& b\\c& d\end{bmatrix}^{-1}=\frac{1}{ad-bc}\begin{bmatrix}d& -b\\-c& a\end{bmatrix}$ 。观察易得，系数项就是行列式的倒数，而矩阵则是由一系列代数余子式组成的。先给出公式：

$A - 1 = 1 det A C T (1)$ $A^{-1}=\frac{1}{\det A}C^T \tag{1}$
注:
1. 矩阵外因子的分母是矩阵的行列式的值，而矩阵是“代数余子式矩阵”（cofactor matrix）C的转置，常被称为” $\color{red}{伴随矩阵}$ ”.
2. 逆矩阵公式的一个好处就是，我们从中可以看到，当改变原矩阵中的一个元素时，给逆矩阵带来了怎样的变化。

证明:
观察这个公式是如何运作的，化简公式得 $AC^T=(\det A)I$ ，写成矩阵形式有 $\begin{bmatrix}a_{11}& a_{12}& \cdots& a_{1n}\\\vdots& \vdots& \ddots& \vdots\\a_{n1}& a_{n2}& \cdots& a_{nn}\end{bmatrix}\begin{bmatrix}C_{11}& \cdots& C_{n1}\\C_{12}& \cdots& C_{n2}\\\vdots& \ddots& \vdots\\C_{1n}& \cdots& C_{nn}\end{bmatrix}=Res$
对于这两个矩阵的乘积，观察其结果的元素 $Res_{11}=a_{11}C_{11}+a_{12}C_{12}+\cdots+a_{1n}C_{1n}$ ，这正是上一讲提到的将行列式按第一行展开的结果。同理，对 $Res_{22}, \cdots, Res_{nn}$ 都有 $Res_{ii}=\det A$ ，即对角线元素均为 $\det A$ 。
再来看非对角线元素：回顾二阶的情况，如果用第一行乘以第二行的代数余子式 $a_{11}C_{21}+a_{12}C_{22}$ ，得到 $a(-b)+ab=0$ 。换一种角度看问题， $a(-b)+ab=0$ 也是一个矩阵的行列式值，即 $A_{s}=\begin{bmatrix}a& b\\a& b\end{bmatrix}$ 。将 $\det A_{s}$ 按第二行展开，也会得到 $\det A_{s}=a(-b)+ab$ ，因为行列式有两行相等所以行列式值为零。
推广到 $n$ 阶，我们来看元素 $Res_{1n}=a_{11}C_{n1}+a_{12}C_{n2}+\cdots+a_{1n}C_{nn}$ ，该元素是第一行与最后一行的代数余子式相乘之积。这个式子也可以写成一个特殊矩阵的行列式，即矩阵 $A_{s}=\begin{bmatrix}a_{11}& a_{12}& \cdots& a_{1n}\\a_{21}& a_{22}& \cdots& a_{2n}\\\vdots& \vdots& \ddots& \vdots\\a_{n-a1}& a_{n-12}& \cdots& a_{n-1n}\\a_{11}& a_{12}& \cdots& a_{1n}\end{bmatrix}$ 。计算此矩阵的行列式，将 $\det A_{s}$ 按最后一行展开，也得到 $\det A_{s}=a_{11}C_{n1}+a_{12}C_{n2}+\cdots+a_{1n}C_{nn}$ 。同理，行列式 $A_{s}$ 有两行相等，其值为零。
结合对角线元素与非对角线元素的结果，我们得到 $Res=\begin{bmatrix}\det A& 0& \cdots& 0\\0& \det A& \cdots& 0\\\vdots& \vdots& \ddots& \vdots\\0& 0& \cdots& \det A\end{bmatrix}$ ，也就是 $(1)$ 等式右边的 $(\det A)I$ ，得证。

2.求解 $Ax=b$

因为我们现在有了逆矩阵的计算公式，所以对 $Ax=b$ 有 $x=A^{-1}b=\frac{1}{\det A}C^Tb$ ，这就是计算 $x$ 的公式，即克莱默法则（Cramer’s rule）。即

$\color{red}{克莱默法则}$ :
1. 定义:对于可逆矩阵 $A$ ，方程 $Ax=b$ 必然有解 $x=A^{-1}b$ ，将逆矩阵公式代入有：
$x=\frac{1}{\det A}C^Tb$ 。
2. 克莱默法则从另外一个角度来看，实际上 $x$ 的分量为：
$x_i=\frac{\det B_i}{\det A}$
其中矩阵 $B_i$ 是向量 $b$ 替代矩阵 $A$ 的第 $j$ 列所得到的新矩阵。

对2进行解析:

现在来观察 $x=\frac{1}{\det A}C^Tb$ ，我们将得到的解拆分开来，对 $x$ 的第一个分量有 $x_1=\frac{y_1}{\det A}$ ，这里 $y_1$ 是一个数字，其值为 $y_1=b_1C_{11}+b_2C_{21}+\cdots+b_nC_{n1}$ ，每当我们看到数字与代数余子式乘之积求和时，都应该联想到求行列式，也就是说 $y_1$ 可以看做是一个矩阵的行列式，我们设这个矩阵为 $B_1$ 。所以有 $x_i=\frac{\det B_1}{\det A}$ ，同理有 $x_2=\frac{\det B_2}{\det A}$ ， $x_3=\frac{\det B_3}{\det A}$ 。
而 $B_1$ 是一个型为 $\Bigg[b a_2 a_3 \cdots a_n\Bigg]$ 的矩阵，即将矩阵 $A$ 的第一列变为 $b$ 向量而得到的新矩阵。其实很容易看出， $\det B_1$ 可以沿第一列展开得到 $y_1=b_1C_{11}+b_2C_{21}+\cdots+b_nC_{n1}$ 。
一般的，有 $B_j=\Bigg[a_1 a_2 \cdots a_{j-1} b a_{j+1} \cdots a_n\Bigg]$ ，即将矩阵 $A$ 的第 $j$ 列变为 $b$ 向量而得到的新矩阵。所以，对于解的分量有 $x_i=\frac{\det B_i}{\det A}$ 。

这个公式虽然很漂亮，但是并不方便计算。因为：

$\det B_1=b_1C_{11}+b_2C_{21}+\cdots+b_nC_{n1}$ 使列向量 $C^Tb$ 的第一个分量，也对应为列向量 $x$ 的第一个分量。
矩阵 $B_j$ 的行列式的数值是伴随矩阵 $C_T$ 的第 $j$ 行与向量 $b$ 点积的结果。此处我们用到了行列式的性质10。相比于消元法，采用克莱姆法则计算方程的解效率较低。所以克莱姆法则计算量太大，不适合编程，消元法可以很好的解决问题，matlab就是用消元法来求解的。

3.行列式的几何意义——体积（Volume）

三阶矩阵A 行列式的绝对值等于以矩阵A 行（列）向量为边所构成的平行六面体的体积。行列式的正负对应左手系和右手系。之前提到过行列式是将矩阵的信息压缩成一个数，可以将“体积”视为它压缩后给出的信息。

先提出命题：行列式的绝对值等于一个箱子的体积。
来看三维空间中的情形，对于 $3$ 阶方阵 $A$ ，取第一行 $(a_1,a_2,a_3)$ ，令其为三维空间中点 $A_1$ 的坐标，同理有点 $A_2, A_3$ 。连接这三个点与原点可以得到三条边，使用这三条边展开得到一个平行六面体， $\left\|\det A\right\|$ 就是该平行六面体的体积。
对于三阶单位矩阵，其体积为 $\det I=1$ ，此时这个箱子是一个单位立方体。这其实也证明了前面学过的行列式性质1。
于是我们想，如果能接着证明性质2、3即可证明体积与行列式的关系。
对于行列式性质2，我们交换两行并不会改变箱子的大小，同时行列式的绝对值也没有改变，得证。
1) 现在我们取矩阵 $A=Q$ ，而 $Q$ 是一个标准正交矩阵，此时这个箱子是一个立方体，可以看出其实这个箱子就是刚才的单位立方体经过旋转得到的。对于标准正交矩阵，有 $Q^TQ=I$ ，等式两边取行列式得 $\det(Q^TQ)=1=\left|Q^T\right|\left|Q\right|$ ，而根据行列式性质10有 $\left|Q^T\right|=\left|Q\right|$ ，所以 $原式=\left|Q\right|^2=1, \left|Q\right|=\pm 1$ 。
2) 接下来在考虑不再是“单位”的立方体，即长方体。假设 $Q$ 矩阵的第一行翻倍得到新矩阵 $Q_2$ ，此时箱子变为在第一行方向上增加一倍的长方体箱子，也就是两个“标准正交箱子”在第一行方向上的堆叠。易知这个长方体箱子是原来体积的两倍，而根据行列式性质3.a有 $\det Q_2=\det Q$ ，于是体积也符合行列式的数乘性质。

二阶行列式是平行四边形的面积。

我们来看二阶方阵的情形， $\begin{vmatrix}a+a'& b+b'\\c& d\end{vmatrix}=\begin{vmatrix}a& b\\c& d\end{vmatrix}+\begin{vmatrix}a'& b'\\c& d\end{vmatrix}$ 。在二阶情况中，行列式就是一个求平行四边形面积的公式，原来我们求由四个点 $(0,0), (a,b), (c,d), (a+c,b+d)$ 围成的四边形的面积，需要先求四边形的底边长，再做高求解，现在只需要计算 $\det A=ad-bc$ 即可（更加常用的是求由 $(0,0), (a,b), (c,d)$ 围成的三角形的面积，即 $\frac{1}{2}ad-bc$ ）。
2.

即：如果知道了歪箱子的顶点坐标，求面积（二阶情形）或体积（三阶情形）时，我们不再需要开方、求角度，只需要计算行列式的值就行了。

再多说两句我们通过好几讲得到的这个公式，在一般情形下，由点 $(x_1,y_1), (x_2,y_2), (x_3,y_3)$ 围成的三角形面积等于 $\frac{1}{2}\begin{vmatrix}x_1& y_1& 1\\x_2& y_2& 1\\x_3& y_3& 1\end{vmatrix}$ ，计算时分别用第二行、第三行减去第一行化简到第三列只有一个 $1$ （这个操作实际作用是将三角形移动到原点），得到 $\frac{1}{2}\begin{vmatrix}x_1& y_1& 1\\x_2-x_1& y_2-y_1& 0\\x_3-x_1& y_3-y_1& 0\end{vmatrix}$ ，再按照第三列展开，得到三角形面积等于 $\frac{(x_2-x_1)(y_3-y_1)-(x_3-x_1)(y_2-y_1)}{2}$ 。

4.总结

1.矩阵的逆 $A^{-1}=\frac{1}{\det A}C^T$

2.

$\color{red}{克莱默法则}$ :
1. 定义:对于可逆矩阵 $A$ ，方程 $Ax=b$ 必然有解 $x=A^{-1}b$ ，将逆矩阵公式代入有：
$x=\frac{1}{\det A}C^Tb$ 。
2. 克莱默法则从另外一个角度来看，实际上 $x$ 的分量为：
$x_i=\frac{\det B_i}{\det A}$
其中矩阵 $B_i$ 是向量 $b$ 替代矩阵 $A$ 的第 $j$ 列所得到的新矩阵。

3.行列式的几何意义：2维为平行四边形面积，3维为立方体的面积。

第二十一讲：特征值和特征向量

1.特征值、特征向量的由来

给定矩阵 $A$ ，矩阵 $A$ 乘以向量 $x$ ，就像是使用矩阵 $A$ 作用在向量 $x$ 上，最后得到新的向量 $Ax$ 。在这里，矩阵 $A$ 就像是一个函数，接受一个向量 $x$ 作为输入，给出向量 $Ax$ 作为输出。

在这一过程中，我们对一些特殊的向量很感兴趣，他们在输入( $x$ )输出( $Ax$ )的过程中始终保持同一个方向，这是比较特殊的，因为在大多情况下， $Ax$ 与 $x$ 指向不同的方向。

在这种特殊的情况下， $Ax$ 平行于 $x$ ，我们把满足这个条件的 $x$ 成为 $\color{red}{特征向量}$ （Eigen vector）,而 $λ$ 为 $A$ 的 $\color{red}{特征值}$ 。这个平行条件用方程表示就是：

$A x = λ x (1)$ $Ax=\lambda x\tag{1}$

对这个式子，我们试着计算特征值为 $0$ 的特征向量，此时有 $Ax=0$ ，也就是特征值为 $0$ 的特征向量应该位于 $A$ 的零空间中。

$\color{red}{ 矩阵是奇异的，那么它将有一个特征值为\lambda = 0}$ 。

我们再来看投影矩阵 $P=A(A^TA)^{-1}A^T$ 的特征值和特征向量。

用向量 $b$ 乘以投影矩阵 $P$ 得到投影向量 $Pb$ ，在这个过程中，只有当 $b$ 已经处于投影平面（即 $A$ 的列空间）中时， $Pb$ 与 $b$ 才是同向的，此时 $b$ 投影前后不变（ $Pb=1\cdot b$ ）。即在投影平面中的所有向量都是投影矩阵的特征向量，而他们的特征值均为1。
再来观察投影平面的法向量，也就是投影一讲中的 $e$ 向量。我们知道对于投影，因为 $e\bot C(A)$ ，所以 $Pe=0e$ ，即特征向量e的特征值为0。

$\color{red}{投影矩阵P=A(A^TA)^{-1}A^T的特征值为\lambda=1, 0}$ 。

再多讲一个例子，二阶置换矩阵 $A=\begin{bmatrix}0& 1\\1& 0\end{bmatrix}$ ，经过这个矩阵处理的向量，其元素会互相交换。即：交换向量 $[x_1 x_2]$ 变为 $[x_2 x_1]$ 的，即 $[x_1 x_2]A=[x_2 x_1]$ ， $x_1,x_2$ 为列向量， $A$ 为列向量线性组合的系数。交换后的 $[x_2 x_1]$ 是初始向量 $[x_1 x_2]$ 与一个因子的乘积。

那么特征值为 $1$ 的特征向量（即经过矩阵交换元素前后仍然不变）应该型为 $\begin{bmatrix}1\\1\end{bmatrix}$ 。

特征值为 $-1$ 的特征向量（即经过矩阵交换元素前后方向相反）应该型为 $\begin{bmatrix}1\\-1\end{bmatrix}$ 。

从例三可得出特征值的性质：
1.对于一个 $n\times n$ 的矩阵，将会有 $n$ 个特征值，而这些特征值的和与该矩阵对角线元素的和相同，因此我们把矩阵对角线元素称为矩阵的迹（trace）。
$\sum i = 1 n λ i = \sum i = 1 n a i i$ $\sum_{i=1}^n \lambda_i=\sum_{i=1}^n a_{ii}$
2.对称矩阵，其特征向量互相垂直。

$\color{red}{根据前面学到的行列式的性质，则有置换矩阵、投影矩阵，矩阵越特殊，则我们得到的特征值与特征向量也越特殊。看置换矩阵中的特征值，两个实数1, -1，而且它们的特征向量是正交的。}$

在上面二阶转置矩阵的例子中，如果我们求得了一个特征值 $1$ ，那么利用迹的性质，我们就可以直接推出另一个特征值是 $-1$ 。

$证明2：$
对称矩阵的特征向量正交： $λ_1$ 和 $λ_2$ 对是对称矩阵 $（A=A^T）$ 的两个不同的特征值，对应的特征向量分别为 $x_1$ 和 $x_2$ 。则有 $Ax_1=λx_1$ ，左乘 $x_2$ 得 $x^T_2Ax_1=λ1x^T_2x_1$ 。而又有
$x^T_2Ax_1=x^T_2A^Tx_1=(Ax_2)^Tx_1=(λ_2x_2)^Tx_1=λ_2x^T_2x^1$ 。因此有 $(λ_1−λ_2)x^T_2x_1=0$ ，而两特征值不等，所以两特征向量正交。

2.求解 $Ax=\lambda x$

对于方程 $Ax=\lambda x$ ，有两个未知数，我们需要利用一些技巧从这一个方程中一次解出两个未知数，先移项得 $(A-\lambda I)x=0$ 。

观察 $(A-\lambda I)x=0$ ，右边的矩阵相当于将 $A$ 矩阵平移了 $\lambda$ 个单位，而如果方程有解，则这个平移后的矩阵 $(A-\lambda I)$ 一定是奇异矩阵，否则唯一的x必须为零向量，零向量是没有用的特征向量。

$det (A - λ I) = 0 (2)$ $\det{(A-\lambda{I})}=0\tag{2}$

这样一来，方程中就没有 $x$ 了，这个方程也叫作特征方程（characteristic equation）。有了特征值，代回 $(A-\lambda I)x=0$ ，继续求 $(A-\lambda I)$ 的零空间即可。

2.1 例1

现在计算一个简单的例子， $A=\begin{bmatrix}3& 1\\1& 3\end{bmatrix}$ 。

则计算 $\det{(A-\lambda{I})}=\begin{vmatrix}3-\lambda& 1\\1& 3-\lambda\end{vmatrix}$ ，也就是对角矩阵平移再取行列式。原式继续化简得 $(3-\lambda)^2-1=\lambda^2-6\lambda+8=0, \lambda_1=4,\lambda_2=2$ 。可以看到一次项系数 $-6$ 与矩阵的迹有关，常数项与矩阵的行列式有关。

继续计算特征向量， $A-4I=\begin{bmatrix}-1& 1\\1& -1\end{bmatrix}$ ，显然矩阵是奇异的（如果是非奇异说明特征值计算有误），解出矩阵的零空间 $x_1=\begin{bmatrix}1\\1\end{bmatrix}$ ；同理计算另一个特征向量， $A-2I=\begin{bmatrix}1& 1\\1& 1\end{bmatrix}$ ，解出矩阵的零空间 $x_2=\begin{bmatrix}1\\-1\end{bmatrix}$ 。

回顾前面转置矩阵的例子，对矩阵 $A'=\begin{bmatrix}0& 1\\1& 0\end{bmatrix}$ 有 $\lambda_1=1, x_1=\begin{bmatrix}1\\1\end{bmatrix}, \lambda_2=-1, x_2=\begin{bmatrix}-1\\1\end{bmatrix}$ 。

看转置矩阵 $A'$ 与本例中的对称矩阵 $A$ 有什么联系。

易得 $A=A'+3I$ ，两个矩阵特征值相同，而其特征值刚好相差 $3$ 。也就是如果给一个矩阵加上 $3I$ ，则它的特征值会加 $3$ ，而特征向量不变。

所以可以得出结论：
1. 如果 $Ax=\lambda x$ ，则 $(A+3I)x=\lambda x+3x=(\lambda+3)x$ ，所以 $x$ 还是原来的 $x$ ，而 $\lambda$ 变为 $\lambda+3$ 。
2. 特征值之和等于矩阵的迹；特征值之积等于矩阵的行列式。
$\prod i = 1 n λ i = det A$ $\prod_{i=1}^n\lambda_i=\det A$
3. 关于特征向量认识的误区：已知 $Ax=\lambda x, Bx=\alpha x$ ，则有 $(A+B)x=(\lambda+\alpha)x$ ，当 $B=3I$ 时，在上例中我们看到，确实成立，但是如果 $B$ 为任意矩阵，则推论不成立，因为这两个式子中的特征向量 $x$ 并不一定相同，所以两个式子的通常情况是 $Ax=\lambda x, By=\alpha y$ ，它们也就无从相加了。

证明2：
在例1中有： $det(A) = \lambda^2-6\lambda+8 =\lambda^2-trace(A)\lambda+det(A)$ 矩阵的迹等于特征值之和。
将 $det（A−λI）=0$ 展开会得到 $λ$ 的 $n$ 阶多项式，多项式的解就是矩阵 $A$ 的特征值。根据多项式根与系数的关系，解之和（即特征值之和）等于 $λ^{n−1 }$ 的系数。举例一元二次方程 $ax^2+bx+c$ 之求根公式是 $x_{1,2}=\frac{−b\pm\sqrt{b^2-4ac}}{2a}$ ，解之和 $x_1+x_2=\frac{−b}{a}$ ，其中 $a=1$ ，所以解之和为 $−b$ 。
而行列式展开式（n阶多项式）中只有对角线的积这一项包含的 $λ^{n−1}$ （其它项最高是 $n-2$ 次方），而其系数为矩阵A 的迹。因此特征值之和与矩阵的迹相等。

2.2例2

再来看旋转矩阵的例子，旋转 $90^\circ$ 的矩阵 $Q=\begin{bmatrix}\cos {90}& -\sin {90}\\sin {90}& \cos {90}\end{bmatrix}=\begin{bmatrix}0& -1\\1& 0\end{bmatrix}$ （将每个向量旋转 $90^\circ$ ，用 $Q$ 表示因为旋转矩阵是正交矩阵中很重要的例子）。

根据上面提到特征值的一个性质：特征值之和等于矩阵的迹和特征值之积等于矩阵的行列式。则对于 $Q$ 矩阵，有 $\begin{cases}\lambda_1+\lambda_2& =0\\\lambda_1\cdot\lambda_2& =1\end{cases}$ ，再来思考特征值与特征向量的由来，哪些向量旋转 $90^\circ$ 后与自己平行，于是遇到了麻烦，并没有这种向量，也没有这样的特征值来满足前面的方程组。

我们来按部就班的计算， $\det(Q-\lambda I)=\begin{vmatrix}\lambda& -1\\1& \lambda\end{vmatrix}=\lambda^2+1=0$ ，于是特征值为 $\lambda_1=i, \lambda_2=-i$ ，我们看到这两个值满足迹与行列式的方程组，即使矩阵全是实数，其特征值也可能不是实数，本例中即出现了一对共轭负数。

我们可以说：
1.如果矩阵越接近对称，那么特征值就是实数。如果矩阵越不对称，就像本例， $Q^T=-Q$ ，这是一个反对称的矩阵，于是我得到了纯虚的特征值，这是极端情况，通常我们见到的矩阵是介于对称与反对称之间的。
2.实数特征值让特征向量伸缩而虚数让其旋转。

于是我们看到，对于好的矩阵（置换矩阵）有实特征值及正交的特征向量，对于不好的矩阵（ $90^\circ$ 旋转矩阵）有纯虚的特征值。

2.3例3

再来看一个更糟的情况， $A=\begin{bmatrix}3& 1\\0& 3\end{bmatrix}$ ，这是一个三角矩阵，我们可以直接得出其特征值，即对角线元素。来看如何得到这一结论的： $\det(A-\lambda I)=\begin{vmatrix}3-\lambda& 1\\0& 3-\lambda\end{vmatrix}=(3-\lambda)^2=0$ ，于是 $\lambda_1=3, \lambda_2=3$ 。而我们说这是一个糟糕的状况，在于它的特征向量。

带入特征值计算特征向量，带入 $\lambda_1=3$ 得 $(A-\lambda I)x=\begin{bmatrix}0& 1\\0& 0\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}$ ，算出一个特征值 $x_1=\begin{bmatrix}1\\0\end{bmatrix}$ ，当我们带入第二个特征值 $\lambda_1=3$ 时，我们无法得到另一个与 $x_1$ 线性无关的特征向量了。

而本例中的矩阵 A <script type="math/tex" id="MathJax-Element-20032">A</script>是一个退化矩阵（degenerate matrix）。

一个退化矩阵，重复的特征值在特殊情况下可能导致特征向量的短缺。

这一讲我们看到了足够多的“不好”的矩阵，下一讲会介绍一般情况下的特征值与特征向量。

3. 总结

1.特征向量和特征值的由来；
2.3个例子得出的结论（对称矩阵、旋转矩阵、三角矩阵的特征值与特征向量的特点）。