线性代数(五)：特征值问题

Albert M

已于 2022-08-01 12:17:54 修改

阅读量1k

点赞数 2

分类专栏：线性代数文章标签：线性代数矩阵

于 2022-07-21 20:14:20 首次发布

本文链接：https://blog.csdn.net/qq_51453181/article/details/125909080

版权

线性代数专栏收录该内容

9 篇文章 1 订阅

订阅专栏

特征值问题

定义5.1：设方阵 $\bold A_n$ ,若存在数 $\lambda$ 与非零向量 $\vec{X}$ ,使得 $A\vec{X}=\lambda\vec{X}$ 则称 $\lambda$ 为方阵 $\bold A$ 的 特征值， $\vec{X}$ 为方阵 $\bold A$ 对应于 $\lambda$ 的 特征向量。

Remark：不可逆矩阵必有0特征值.
证明：若 $A$ 不可逆，则 $A\vec{X}=0$ 存在非零解 $\vec{X}_0$ ,故 $A\vec{X}_0=0=0\vec{X}_0$

特征值与特征向量的计算：

$A\vec{X}=\lambda\vec{X}\Longleftrightarrow (A-\lambda E)\vec{X}=0\qquad (1)$
若(1)有非零解，则 $f(\lambda)=det(A-\lambda E)=0$ ，将 $f(\lambda)$ 称作 A的特征多项式，求解出复数域的 $n$ 个特征值后则可反代入 $(1)$ 求解得到对应的特征向量。

关于特征多项式的展开：

$f(\lambda)=det(A-\lambda E)= \begin{vmatrix} %1 a_{11}-\lambda&a_{12}&a_{13}&a_{14}&\dots&a_{1n}\\ a_{21}&a_{22}-\lambda&a_{23}&a_{24}&\dots&a_{1n}\\ a_{31}&a_{32}&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ a_{41}&a_{42}&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}= \begin{vmatrix} %2.1 a_{11}&a_{12}&a_{13}&a_{14}&\dots&a_{1n}\\ a_{21}&a_{22}-\lambda&a_{23}&a_{24}&\dots&a_{1n}\\ a_{31}&a_{32}&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ a_{41}&a_{42}&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}+ \begin{vmatrix}%2.2 -\lambda&a_{12}&a_{13}&a_{14}&\dots&a_{1n}\\ 0&a_{22}-\lambda&a_{23}&a_{24}&\dots&a_{1n}\\ 0&a_{32}&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ 0&a_{42}&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ 0&a_{n2}&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}\\ \qquad\\= \begin{vmatrix}%3.1 a_{11}&a_{12}&a_{13}&a_{14}&\dots&a_{1n}\\ a_{21}&a_{22}&a_{23}&a_{24}&\dots&a_{1n}\\ a_{31}&a_{32}&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ a_{41}&a_{42}&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}+ \begin{vmatrix}%3.2 a_{11}&0&a_{13}&a_{14}&\dots&a_{1n}\\ a_{21}&-\lambda&a_{23}&a_{24}&\dots&a_{1n}\\ a_{31}&0&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ a_{41}&0&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ a_{n1}&0&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda \end{vmatrix}+ \begin{vmatrix}%3.3 -\lambda&a_{12}&a_{13}&a_{14}&\dots&a_{1n}\\ 0&a_{22}&a_{23}&a_{24}&\dots&a_{1n}\\ 0&a_{32}&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ 0&a_{42}&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ 0&a_{n2}&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}+ \begin{vmatrix}%3.4 -\lambda&0&a_{13}&a_{14}&\dots&a_{1n}\\ 0&-\lambda&a_{23}&a_{24}&\dots&a_{1n}\\ 0&0&a_{33}-\lambda&a_{34}&\dots&a_{1n}\\ 0&0&a_{43}&a_{44}-\lambda&\dots&a_{1n}\\ \vdots&\vdots&\vdots&\vdots&&\vdots\\ 0&0&a_{n3}&a_{n4}&\dots&a_{nn}-\lambda\\ \end{vmatrix}\\ \quad\\ 记符号A_{(n)a_i\leftrightarrow e_i}^{m}表示将n阶方阵的任意m个列向量a_i替换为对应的单位向量e_i后得到的C_n^m个矩阵，如A_{(2)a_i\leftrightarrow e_i}^1=\{\begin{bmatrix}1&a_12\\0&a_{22}\end{bmatrix}、\begin{bmatrix}a_{11}&0\\a_{21}&1\end{bmatrix}\},而det(A_{(n)a_i\leftrightarrow e_i}^m)表示这一组方阵行列式之和，那么：\\\quad\\ f(\lambda)=\sum_{m=0}^ndet(A_{(n)a_i\leftrightarrow \lambda e_i}^m)=\sum_{m=0}^n\sum_{l=1}^{C_n^m}(-\lambda)^mP^l_{(n-m)}=\sum_{m=0}^n(-\lambda)^m\sum_{l=1}^{C_n^m}P^l_{(n-m)}(说明：求解det(A_{(n)a_i\leftrightarrow \lambda e_i}^m)时按照\lambda e_i所在的列展开，P^l_{(n-m)}为一个n-m阶主子式)\\ \quad$
上式说明特征多项式 $(-\lambda)^m$ 项的系数为 $n$ 阶方阵 $A$ 所有 $(n - m)$ 阶主子式的和

定理5.1：设 $n$ 阶方阵的 $n$ 个特征值为： $\lambda_i\quad(i=1,2,\dots,n)$ ，则：
（1） $det(A)=\lambda_1\lambda_2\bullet\dots\bullet\lambda_n$
（2） $\lambda_1+\lambda_2+\dots+\lambda_n=a_{11}+a_{22}+\dots+a_{nn}=tr(A)$

（1）证明： $det(A-\lambda E)=(-\lambda+\lambda_1)(-\lambda+\lambda_2)\bullet\dots\bullet(-\lambda+\lambda_n)=(-1)^n\lambda^n+(-1)^{n-1}(\lambda_1+\lambda_2+\dots+\lambda_n)\lambda^{n-1}+\dots+\lambda_1\lambda_2\bullet\dots\bullet\lambda_n$
令 $\lambda=0$ ,则 $det(A)=\lambda_1\lambda_2\bullet\dots\bullet\lambda_n$ （证毕）

（2）证明：
由（1）知特征值之和为 $(-\lambda)^{n-1}$ 的系数，应等于所有一阶主子式之和，即对角元素之和，那么：
$\lambda_1+\lambda_2+\dots+\lambda_n=a_{11}+a_{22}+\dots+a_{nn}（证毕）$

推论5.1：方阵 $A_n$ 可逆 $\Longleftrightarrow$ 其特征值 $\lambda_i\ne0\quad(i=1,2,\dots,n)$

定理5.2：方阵 $A$ 的特征值为 $\lambda$ ，特征向量为 $\vec{X}$ ，则
（1） $A^{-1}$ 的特征值为 $\lambda^{-1}$ ，特征向量为 $\vec{X}$ ；
（2）矩阵多项式 $g(A)=a_kA^k+a_{k-1}A^{k-1}+\dots+a_1A+a_0E$ 的特征值为 $g(\lambda)=a_k\lambda^k+a_{k-1}\lambda^{k-1}+\dots+a_1\lambda+a_0$ ，特征向量为 $\vec{X}$

（1）证明：

$\qquad A\vec{X}=\lambda\vec{X}\Longrightarrow \vec{X}=A^{-1}\lambda\vec{X}\Longrightarrow A^{-1}\vec{X}=\lambda^{-1}\vec{X}$ （证毕）

（2）证明：

$\qquad g(A)\vec{X}=a_kA^k\vec{X}+a_{k-1}A^{k-1}\vec{X}+\dots+a_1A\vec{X}+a_0\vec{X}$

$\qquad =a_k\lambda^k\vec{X}+a_{k-1}\lambda^{k-1}\vec{X}+\dots+a_1\lambda\vec{X}+a_0\vec{X}=g(\lambda)\vec{X}$ （证毕）

由于 $\lambda_i$ 对应的特征向量集合是 $(A-\lambda_i E)\vec{X}=0$ 的解空间，故 $\lambda_i$ 对应的特征向量的线性组合仍然是 $\lambda_i$ 对应的特征向量。

定理5.3：不同特征值对应的特征向量线性无关。
证明：采用数学归纳法：
$\ \qquad$ $\vec{X}_1$ 与 $\vec{X}_2$ 分别为 $\lambda_1$ 与 $\lambda_2$ 对应的特征向量 $(\lambda_1\ne \lambda_2)$ 。
$\ \qquad$ 令 $k_1\vec{X}_1+k_2\vec{X}_2=0\qquad (1)$
$\ \qquad$ 则 $A(k_1\vec{X}_1+k_2\vec{X}_2)=k_1\lambda_1\vec{X}_1+k_2\lambda_2\vec{X}_2=0\qquad (2)$
$\ \qquad$ 那么， $(1)\times\lambda_1-(2):k_2(\lambda_1-\lambda_2)\vec{X}_2=0\Longrightarrow k_2=0$
$\ \qquad\ \ \qquad$ $(1)\times\lambda_2-(2):k_1(\lambda_2-\lambda_1)\vec{X}_2=0\Longrightarrow k_1=0$
$\ \qquad$ 即， $\vec{X}_1$ 与 $\vec{X}_2$ 线性无关。
$\ \qquad$ 假设 $\lambda_1,\lambda_2,\dots,\lambda_{r-1}$ 对应的特征向量 $\vec{X}_1,\vec{X}_2,\dots,\vec{X}_{r-1}$ 线性无关。
$\ \qquad$ 讨论 $\vec{X}_1，\vec{X}_2，\dots，\vec{X}_{r-1}，\vec{X}_r$ 的线性相关性。
$\ \qquad$ 令 $k_1\vec{X}_1+k_2\vec{X}_2+\dots+k_r\vec{X}_r=0\qquad (3)$
$\ \qquad$ 则 $A(k_1\vec{X}_1+k_2\vec{X}_2+\dots+k_r\vec{X}_r)=k_1\lambda_1\vec{X}_1+k_2\lambda_2\vec{X}_2+\dots+k_r\lambda_r\vec{X}_r=0\qquad (4)$
$\ \qquad$ 那么， $(3)\times\lambda_r-(4):$
$k_1(\lambda_r-\lambda_1)\vec{X}_1+k_2(\lambda_r-\lambda_2)\vec{X}_2+\dots+k_{r-1}(\lambda_r-\lambda_{r-1})\vec{X}_{r-1}=0$
$\ \qquad$ 由于 $\vec{X}_1，\vec{X}_2，\dots\vec{X}_{r-1}$ 线性无关
$\ \qquad$ 则 $k_{i}(\lambda_r-\lambda_{i})=0\ (i=1,\dots,r-1)\Longrightarrow k_i=0\ (i=1,\dots,r-1)$
$\ \qquad$ 带入式(3)， $k_r=0$
$\ \qquad$ 故， $\vec{X}_1，\vec{X}_2，\dots，\vec{X}_{r-1}，\vec{X}_r$ 线性无关。

定理5.4：将不同特征值对应的线性无关特征向量组进行组合得到的向量组依然线性无关。即，
设 $\lambda_1，\lambda_2，\dots,\lambda_{r}$ 为 $A$ 的不同特征值且 $\vec{X}_{1i}，\vec{X}_{2i}，\dots，\vec{X}_{s_i,i}$ 为特征值 $\lambda_i$ 对应的 $s_i$ 个线性无关的特征向量，则 $\vec{X}_{11}，\vec{X}_{21}，\dots，\vec{X}_{s_1,1}，\vec{X}_{12}，\vec{X}_{22}，\dots，\vec{X}_{s_2,2}，\vec{X}_{1r}，\vec{X}_{2r}，\dots，\vec{X}_{s_r,r}$ 向量组依然线性无关。

证明：令 $\sum_{j=1}^{s_i}k_{ji}\vec{X}_{ji}=\sum_{j=1}^{s_1}k_{j1}\vec{X}_{j1}+\sum_{j=1}^{s_2}k_{j2}\vec{X}_{j2}+\dots+\sum_{j=1}^{s_r}k_{jr}\vec{X}_{jr}=\vec{Z}_{1}+\vec{Z}_{2}+\dots+\vec{Z}_{r}$
由于 $\lambda_i$ 对应的特征向量的线性组合 $\vec{Z}_{i}$ 仍然是 $\lambda_i$ 对应的特征向量，则
$\vec{Z}_{1}+\vec{Z}_{2}+\dots+\vec{Z}_{r}=0$ 成立当且仅当 $\vec{Z}_{i}=0\ (i=1,\dots,r)$ 。
又，选取的是同一特征值对应的线性无关特征向量，则 $k_{ji}=0$ .
故，将不同特征值对应的线性无关特征向量组进行组合得到的向量组依然线性无关。（证毕）
定理5.4：代数重数（特征多项式根 $\lambda$ 的重数） $\ge$ 几何重数（ $\lambda$ 对应的特征向量构成的向量空间的维数）。
证明：过程参考出处
$\ \qquad$ 设 $\lambda$ 为方阵 $A_n$ 的一个特征值，并假设其对应的特征向量构成的向量空
$\ \qquad$ 间 $V$ ( $R^n的子空间)$ 维数为 $r$ ,基为 $\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r\}$ ,将其扩充为 $R^n$ 中
$\ \qquad$ 的一组基 $\{\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},...,,\vec{\alpha}_n\}$ 。

$\ \qquad$ 则 $\begin{cases}A\vec{\alpha}_i=\lambda\vec{\alpha}_i\qquad (i=1,...,r)\\ A\vec{\alpha}_i=k_{1i}\vec{\alpha}_1+k_{2i}\vec{\alpha}_2+...+k_{ni}\vec{\alpha}_n\ (i=r+1,...,n)\end{cases}$
$\ \qquad$ 即，
$A[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},...,\vec{\alpha}_n]=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},\dots,\vec{\alpha}_n]\begin{bmatrix} \lambda\ 0\ \dots \ 0\quad k_{1,r+1}\ \dots \quad k_{1,n}\\ 0\ \lambda\ \dots \ 0\quad k_{2,r+1}\ \dots \quad k_{2,n}\\ \vdots \\ 0\ 0\ \dots \ \lambda\quad k_{r,r+1}\ \dots \quad k_{r,n}\\ 0\ 0\ \dots \ 0\ k_{r+1,r+1}\ \dots \ k_{r+1,n}\\ 0\ 0\ \dots \ 0\ k_{r+2,r+1}\ \dots \ k_{r+2,n}\\ \vdots \\ 0\ 0\ \dots \ 0\quad k_{n,r+1}\ \dots \quad k_{n,n} \end{bmatrix}$
$\ \qquad$ 则
$(A-\lambda'E)[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},...,\vec{\alpha}_n]=[\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},\dots,\vec{\alpha}_n]\begin{bmatrix} (\lambda-\lambda') & 0 & \dots & 0 & k_{1,r+1} & \dots & k_{1,n}\\ 0& (\lambda-\lambda')& \dots & 0& k_{2,r+1}& \dots & k_{2,n}\\ \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\ 0& 0& \dots & (\lambda-\lambda')& k_{r,r+1}& \dots& k_{r,n}\\ 0& 0& \dots & 0& (k_{r+1,r+1}-\lambda')& \dots & k_{r+1,n}\\ 0& 0& \dots & 0& \quad k_{r+2,r+1} & \dots & k_{r+2,n}\\ \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\ 0& 0& \dots & 0& k_{n,r+1}&\dots & (k_{n,n}-\lambda') \end{bmatrix}$
$\ \qquad$ 因 $det([\vec{\alpha}_1,\vec{\alpha}_2,\dots,\vec{\alpha}_r,\vec{\alpha}_{r+1},...,\vec{\alpha}_n])\ne0$ 进一步有特征多项式：
$det(A-\lambda'E)=\begin{vmatrix} (\lambda-\lambda') & 0 & \dots & 0 & k_{1,r+1} & \dots & k_{1,n}\\ 0& (\lambda-\lambda')& \dots & 0& k_{2,r+1}& \dots & k_{2,n}\\ \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\ 0& 0& \dots & (\lambda-\lambda')& k_{r,r+1}& \dots& k_{r,n}\\ 0& 0& \dots & 0& (k_{r+1,r+1}-\lambda')& \dots & k_{r+1,n}\\ 0& 0& \dots & 0& k_{r+2,r+1} & \dots & k_{r+2,n}\\ \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\ 0& 0& \dots & 0& k_{n,r+1}&\dots & (k_{n,n}-\lambda') \end{vmatrix}=\begin{vmatrix} (\lambda-\lambda') & 0 & \dots & 0 \\ 0& (\lambda-\lambda')& \dots & 0\\ \vdots& \vdots&\vdots&\vdots\\ 0& 0& \dots & (\lambda-\lambda')\\ \end{vmatrix}_{r\times r}\begin{vmatrix} (k_{r+1,r+1}-\lambda')& \dots & k_{r+1,n}\\ k_{r+2,r+1} & \dots & k_{r+2,n}\\ \vdots &\vdots &\vdots \\ k_{n,r+1}&\dots & (k_{n,n}-\lambda') \end{vmatrix}_{(n-r)\times (n-r)}=(\lambda-\lambda')^rg(\lambda')$
显然， $det(A-\lambda'E)=(\lambda-\lambda')^rg(\lambda')=0$ 的根 $\lambda$ 的重数大于等于 $r$ 。（证毕）

定理5.5：实对称方阵的特征值为实数，且不同特征值对应的特征向量正交。

证明：设 $\lambda$ 为实对称矩阵 $\bold A_{n\times n}$ 的特征值， $\vec{X}$ 为 $\lambda$ 对应的 $\bold A$ 的特征向量,则 $\bold{A}\vec{X}=\lambda\vec{X}\qquad(1)$ $\ \ \qquad$ 对 $(1)$ 式进行共轭转置并右乘 $\vec{X}$ 得： $\bar{\vec{X}}^T\bar{\bold{A}}^T\vec{X}=\bar{\lambda}\bar{\vec{X}}^T\vec{X}\qquad(2)$ $\ \ \qquad$ 又由 $(1)$ 得： $\bar{\vec{X}}^T\bold{A}\vec{X}=\lambda\bar{\vec{X}}^T\vec{X}\qquad(3)$ $\ \ \qquad$ $(2) - (3)$ 得： $(\bar{\lambda}-\lambda)\bar{\vec{X}}^T\vec{X}=0$ $\ \ \qquad$ 由于 $\vec{X}\ne 0$ ，故 $\bar{\lambda}=\lambda$ ，即特征值 $\lambda$ 为实数。
$\ \ \qquad$ 设 $\vec{X}_1,\vec{X}_2$ 分别为互异特征值 $\lambda_1,\lambda_2$ 对应的特征向量,则： $\begin{cases}A\vec{X}_1=\lambda_1\vec{X}_1\\ A\vec{X}_2=\lambda_2\vec{X}_2\end{cases}\Longrightarrow(\lambda_1\vec{X}_1,\vec{X}_2)=(A\vec{X}_1,\vec{X}_2)=\vec{X}_1^TA^T\vec{X}_2=\vec{X}_1^TA\vec{X}_2=(\vec{X}_1,A\vec{X}_2)=(\vec{X}_1,\lambda_2\vec{X}_2)\Longrightarrow(\lambda_1-\lambda_2)(\vec{X}_1,\vec{X}_2)=0$ $\ \ \qquad$ 则 $(\vec{X}_1,\vec{X}_2)=0$ （证毕）