《矩阵理论》大萌课程笔记 - 矩阵分解

最新推荐文章于 2023-02-06 15:50:14 发布

minipuding

最新推荐文章于 2023-02-06 15:50:14 发布

阅读量612

点赞数 2

分类专栏：【矩阵理论】大萌课程笔记文章标签：矩阵线性代数

本文链接：https://blog.csdn.net/youduba7/article/details/122488355

版权

【矩阵理论】大萌课程笔记专栏收录该内容

8 篇文章 19 订阅

订阅专栏

《矩阵理论》大萌课程笔记 - 矩阵分解

总目录

章节名称与链接
线性空间与线性变换	线性空间与子空间
	有限维线性空间、基、维数
	线性变换
内积空间
特征值与特征向量
特殊矩阵
矩阵分解
矩阵函数

声明

本专栏博客用于记录上海交通大学研究生课程《矩阵理论》笔记，课程任教老师为邓大萌老师。所有内容均为博主个人的课堂笔记，包括课堂例题与证明。如有不妥、错误之处欢迎大家指正。

文章目录

1 正交三角分解

定义： $A_{m\times n}=U_{m\times n}\cdot R_{n\times n}$ ，其中 $U$ 的列向量是标准正交向量(单位化，正交化)， $R$ 是主对角元素大于0的上三角阵

条件： $A$ 是列满秩矩阵

分解方法：斯密特正交化法，按照A的列向量标准正交化，得到的标准正交向量构成 $U$ ,系数为 $R$

性质：正交三角分解的结果唯一

2 谱分解

定义：已知矩阵 $A$ 可以相似对角化， $P^{-1}AP=\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&...&\\&&&\lambda_n\end{bmatrix}\Rightarrow A=P\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&...&\\&&&\lambda_n\end{bmatrix}P^{-1}$

设 $P=(\alpha_1,\alpha_2,...,\alpha_n),P^{-1}=(\beta_1^T,\beta_2^T,...,\beta_n^T)^T$

$A=\lambda_1\alpha_1\beta_1^T+\lambda_2\alpha_2\beta_2^T+...+\lambda_n\alpha_n\beta_n^T=\Sigma_{i=1}^n\lambda_iG_i,G_i=\alpha_i\cdot\beta_i^T$

条件： $A$ 是方阵且可以对角化

分解方法：先求解特征值，再求特征向量得到 $P$ ，最后按行列写成定义形式。

性质：

$\Sigma_{i=1}^kG_i=E$

证明： $\Sigma_{i=1}^kG_i=\alpha_1\beta_1^T+\alpha_2\beta_2^T+...+\alpha_n\beta_n^T=(\alpha_1,\alpha_2,...,\alpha_n)\cdot (\beta_1^T,\beta_2^T,...,\beta_n^T)^T=P\cdot P^{-1}=E$

证毕。

$G_i\cdot G_i=G_i,G_i\cdot G_j=0$

证明： $P^{-1}\cdot P=(\beta_1^T,\beta_2^T,...,\beta_n^T)^T\cdot(\alpha_1,\alpha_2,...,\alpha_n)=E$

$\Rightarrow \beta_i^T\cdot\alpha_i=1,\beta_i^T\cdot\alpha_j=0$

$\Rightarrow (\alpha_i\beta_i)^2=\alpha_i\beta_i,(\alpha_i\beta_j)^2=0$

$\Rightarrow G_i^2=(\alpha_{k}\beta_{k}+\alpha_{k+1}\beta_{k+1}+...+\alpha_{k+n_i}\beta_{k+n_i})^2=G_i,G_i\cdot G_j=0$ ，证毕。

$r(G_i)=n_i$ ， $n_i$ 是重数

证明：已知 $G_i=\alpha_{k}\beta_{k}+\alpha_{k+1}\beta_{k+1}+...+\alpha_{k+n_i}\beta_{k+n_i}\Rightarrow G_i$ 每一列向量由 $\alpha_k,\alpha_{k+1},...,\alpha_{k+n_i}$ 线性组合得到

已知线性无关组 $\le$ 张成组，因此 $r(G_i)\le n_i$

又 $\Sigma_{i=1}^k G_i=E\Rightarrow \Sigma_{i=1}^k r(G_i)\ge r(\Sigma_{i=1}^k G_i)=r(E)=n=\Sigma_{i=1}^kn_i$

$\Rightarrow r(G_i)=n_i$

谱分解的结果唯一

证明：假设谱分解结果不唯一，则存在 $A=\lambda_1G_1+\lambda_2G_2+...+\lambda_kG_k=\lambda_1P_1+\lambda_2P_2+...+\lambda_k P_k$

等式两边左乘 $G_i,1\le i\le k\Rightarrow \lambda_iG_i=G_i(\lambda_1P_1+\lambda_2P_2+...+\lambda_k P_k)$

等式两边右乘 $P_j,1\le j\le k,j\not=i\Rightarrow \lambda_i G_iP_j=\lambda_jG_iP_j$

$\because \lambda_i\not=\lambda_j\Rightarrow G_iP_j=0,i\not=j$

$\Rightarrow \lambda_iG_i=G_i(\lambda_1P_1+\lambda_2P_2+...+\lambda_k P_k)=\lambda_iG_iP_i$

$\lambda_i P_i=(\lambda_1G_1+\lambda_2G_2+...+\lambda_kG_k)P_i=\lambda_iG_iP_i$

$G_i=P_i\Rightarrow$ 谱分解唯一

正规矩阵一定有谱分解

例：“度量矩阵一定有谱分解”是对是错？

度量矩阵是Hermite阵/正定阵 $\Rightarrow$ 度量矩阵是正规矩阵 $\Rightarrow$ 正规矩阵一定有有谱分解

所以，度量矩阵一定有谱分解，对

3 三角分解

定义：将方阵 $A$ 分解为单位下三角阵（对角线元素为1）和上三角阵， $A = L R$

条件： $n\times n$ 方阵， $r (A) = r$ ，前 $r$ 阶顺序主子式不等于0

分解方法：高斯消元法（行变换化标准型）/左乘行变换矩阵

例： $A=\begin{bmatrix}1&2&4\\2&3&5\\3&5&9\end{bmatrix}$ ，求 $A$ 的三角分解。

$\begin{bmatrix}1&&\\-2&1&\\-3&&1\end{bmatrix}A=\begin{bmatrix}1&2&4\\0&-1&-3\\0&-1&-3\end{bmatrix}$

$\Rightarrow \begin{bmatrix}1&&\\&1&\\&-1&1\end{bmatrix}\begin{bmatrix}1&&\\-2&1&\\-3&&1\end{bmatrix}A=\begin{bmatrix}1&&\\-2&1&\\-1&-1&1\end{bmatrix}A=\begin{bmatrix}1&2&4\\0&-1&-3\\0&0&0\end{bmatrix}$

$\Rightarrow A=\begin{bmatrix}1&&\\-2&1&\\-1&-1&1\end{bmatrix}^{-1}\begin{bmatrix}1&2&4\\0&-1&-3\\0&0&0\end{bmatrix}=\begin{bmatrix}1&&\\2&1&\\3&1&1\end{bmatrix}\begin{bmatrix}1&2&4\\0&-1&-3\\0&0&0\end{bmatrix}$

性质：三角分解唯一

$\star\star\star$ 特殊的类三角分解：Cholesky分解

定义：若 $A$ 是正定矩阵，则存在上三角阵 $R$ 使得 $A=R^*R$ ，该分解成为Cholesky分解（注意： $A$ 正定隐含的条件是 $A$ 为Hermite阵）

证明：已知 $A$ 是正定矩阵 $\Rightarrow A$ 是Hermite阵 $\Rightarrow A$ 可以酉对角化

则存在酉矩阵 $U$ 使得 $U^*AU=\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&...&\\&&&\lambda_n\end{bmatrix}\Rightarrow A=U\begin{bmatrix}\lambda_1&&&\\&\lambda_2&&\\&&...&\\&&&\lambda_n\end{bmatrix}U^*$

又因为 $A$ 是正定矩阵 $\Rightarrow \lambda_i>0,1\le i\le n$

$\therefore A=U\begin{bmatrix}\sqrt\lambda_1&&&\\&\sqrt\lambda_2&&\\&&...&\\&&&\sqrt\lambda_n\end{bmatrix}\begin{bmatrix}\sqrt\lambda_1&&&\\&\sqrt\lambda_2&&\\&&...&\\&&&\sqrt\lambda_n\end{bmatrix}U^*$

令 $B=\begin{bmatrix}\sqrt\lambda_1&&&\\&\sqrt\lambda_2&&\\&&...&\\&&&\sqrt\lambda_n\end{bmatrix}U^*\Rightarrow B^*=U\begin{bmatrix}\sqrt\lambda_1&&&\\&\sqrt\lambda_2&&\\&&...&\\&&&\sqrt\lambda_n\end{bmatrix}$

因为 $B$ 是列满秩矩阵，因此存在正交三角分解，即 $B=QR,B^*=R^*Q^*,Q^*Q=E$

$\Rightarrow A=B^*B=R^*Q^*QR=R^*R$ ，证毕

求解方法：行、列变换 $\Rightarrow$ 求逆 $\Rightarrow$ 拆分 $\Rightarrow$ 合并

例： $A=\begin{bmatrix}1&2\\2&6\end{bmatrix}$ ，求 $A$ 的Cholesky分解

对 $A$ 进行行列变换得： $\begin{bmatrix}1&\\-2&1\end{bmatrix}A\begin{bmatrix}1&-2\\&1\end{bmatrix}=\begin{bmatrix}1&\\&2\end{bmatrix}=\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}$

$\Rightarrow A=\begin{bmatrix}1&\\-2&1\end{bmatrix}^{-1}\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}\begin{bmatrix}1&-2\\&1\end{bmatrix}^{-1}=\begin{bmatrix}1&\\2&1\end{bmatrix}\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}\begin{bmatrix}1&\\&\sqrt2\end{bmatrix}\begin{bmatrix}1&2\\&1\end{bmatrix}=\begin{bmatrix}1&\\2&\sqrt2\end{bmatrix}\begin{bmatrix}1&2\\&\sqrt2\end{bmatrix}$

4 奇异值分解（ $\star\star\star$ 必考大题15分）

定义：矩阵 $A_{m\times n}$ 可以分解为 $A_{m\times n}=U_{m\times m}\cdot D_{m\times n}\cdot V^*_{n\times n}$ ，其中 $U,V^*$ 是酉矩阵， $r (A) = r$ $D_{m\times n}=\begin{bmatrix}\delta_1\\&\delta_2\\&&...\\&&&\delta_r\\&&&&0\\&&&&&...\\&&&&&&0\end{bmatrix},\delta_i>0,0\le i\le r,\delta_i$ 就是奇异值

$AA^*=U_{m\times m}\cdot \begin{bmatrix}\delta_1^2\\&\delta_2^2\\&&...\\&&&\delta_r^2\\&&&&0\\&&&&&...\\&&&&&&0\end{bmatrix}_{m\times m}\cdot U^*_{m\times m}$

$A^*A=V_{n\times n}\cdot \begin{bmatrix}\delta_1^2\\&\delta_2^2\\&&...\\&&&\delta_r^2\\&&&&0\\&&&&&...\\&&&&&&0\end{bmatrix}_{n\times n}\cdot V^*_{n\times n}$

存在以下结论保证任意 $A$ 均有此分解：

$r(A)=r(AA^*)=r(A^*A)$

证明：
若证得 $N(A)=N(A^*A)$ ，则可得到 $n-r(A)=n-r(A^*A)\Rightarrow r(A)=r(A^*A)$

设 $\forall\alpha\in N(A),A\alpha=0\Rightarrow A^*A\alpha=0,\alpha\in N(A^*A)\Rightarrow N(A)\sube N(A^*A)$

设 $\forall \beta\in N(A^*A),A^*A\beta=0\Rightarrow \beta^*A^*A\beta=(A\beta,A\beta)=0\Rightarrow,A\beta=0\Rightarrow \beta\in N(A)\Rightarrow N(A^*A)\sube N(A)$

$\Rightarrow N(A)=N(A^*A)\Rightarrow r(A)=r(A*A)$

同理可证 $r(A)=r(AA^*)$

$\Rightarrow r(A)=r(AA^*)=r(A^*A)$

$AA^*$ 与 $A^*A$ 非零特征值相同且对应重数也相同

证明：
$(AA^*)^*=AA^*,(A^*A)^*=A^*A\Rightarrow AA^*$ 与 $A^*A$ 都是Hermite矩阵 $\Rightarrow A^*A,AA^*$ 可以酉对角化

设 $\lambda_i$ 是 $A^*A$ 的特征向量 $,1\le i\le r,\alpha_i$ 是对应的特征值，则 $A^*A\alpha_i=\lambda_i\alpha_i$

$\Rightarrow AA^*A\alpha_i=\lambda_iA\alpha_i\Rightarrow A\alpha_i$ 是 $AA^*$ 的特征向量， $\lambda_i$ 是对应的特征值

$\Rightarrow AA^*$ 与 $A^*A$ 的特征值相同

$AA^*$ 与 $A^*A$ 半正定

证明： $x^*A^*Ax=(Ax,Ax)=||Ax||^2\ge 0\Rightarrow A^*A$ 半正定，同理， $AA^*$ 半正定

$AA^*$ 或者 $A^*A$ 的特征值开方等于奇异值
若 $AA^*$ 的单位正交特征向量为 $\alpha_1,\alpha_2,...,\alpha_r,A^*A$ 的单位正交特征向量为 $\frac{A^*\alpha_1}{\sqrt\lambda_1},\frac{A^*\alpha_2}{\sqrt\lambda_2},...,\frac{A^*\alpha_r}{\sqrt\lambda_r}$

奇异值分解变体–极分解

当 $A$ 是一个方阵时， $A=UDV^*=(UDU^*)(UV^*)$ ，其中 $UDU^*$ 是一个Hermite阵且特征值大于等于 $0$ ，因此 $UDU^*$ 是半正定阵； $UV^*$ 是两个酉矩阵相乘，结果仍然为酉矩阵，若 $A$ 可逆，则 $D_{ii}>0,UDU^*$ 是正定阵。

例1：证明 $A_{n\times n},r(A)=r$ 可以分解为幂等阵与可逆阵的乘积，即 $A = P Q, P, Q$ 分别为幂等阵与可逆阵

方法一：

证明：已知幂等矩阵的特征值为0或1，不妨令 $B = d i a g (1, 1 . . ., 1, 0, . . ., 0)$ ，其中1的个数为r

$A=UDV^*=U(BD)V^*=U(BD')V^*=(UBU^*)(UD'V^*)，D'=diag(\delta_1,\delta_2,...,\delta_r,1,...,1)$

令 $P=UBU^*,Q=UD'V^*\Rightarrow P^2=UBU^*UBU^*=UB^2U^*=UBU^*=P\Rightarrow P$ 是幂等阵

又令 $Q=UD'V^*$ ，由 $U,D',V^*$ 均为可逆阵得 $Q$ 为可逆阵

$\Rightarrow A=PQ$ 证毕

方法二：

证明：设 $P^{'}, Q^{'}$ 为 $A$ 的行、列变换阵，使得A化为形如 $B = d i a g (1, 1 . . ., 1, 0, . . ., 0)$ 形式

则 $P'AQ'=B\Rightarrow A=P'^{-1}BQ'^{-1}=(P'^{-1}BP')(P'^{-1}Q'^{-1})$

其中令 $P=P'^{-1}BP',Q=P'^{-1}Q'^{-1}$ ，则 $P, Q$ 分别是幂等阵与可逆阵， $A = P Q$ 证毕。

例2：试将正规矩阵 $A$ 的谱分解改写为奇异值分解

解： $A$ 的谱分解为 $A=UBU^*$ ，其中 $U$ 是酉矩阵， $B=diag(\lambda_1,\lambda_2,...,\lambda_r,0,...,0)$

将 $B$ 改写为 $B=PQ,P=diag(|\lambda_1|,|\lambda_2|,...,|\lambda_r|,0,...,0) ,Q= diag(\frac{\lambda_1}{|\lambda_1|},\frac{\lambda_2}{|\lambda_2|},...,\frac{\lambda_r}{|\lambda_r|},1,...,1)$

其中 $P$ 是半正定矩阵， $Q$ 是酉矩阵，令 $V^*=QU^*$

$\Rightarrow A=UPV^*$ ，改写完成

注：其实可以利用极分解来改写， $A=UBU^*,B=PQ，P$ 是半正定阵， $Q$ 是酉矩阵…

例3：已知 $A=UD_1U^*,B=VD_2V^*,D_1,D_2$ 是半正定矩阵，求 $C=\begin{bmatrix}0&A\\B&0\end{bmatrix}$ 的奇异值分解

解： $C=\begin{bmatrix}0&A\\B&0\end{bmatrix}=\begin{bmatrix}A&0\\0&B\end{bmatrix}\cdot \begin{bmatrix}0&1\\1&0\end{bmatrix}=\begin{bmatrix}U&0\\0&V\end{bmatrix}\cdot \begin{bmatrix}D_1&0\\0&D_2\end{bmatrix}\cdot \begin{bmatrix}U^*&0\\0&V^*\end{bmatrix}\begin{bmatrix}0&1\\1&0\end{bmatrix}$

$=\begin{bmatrix}U&0\\0&V\end{bmatrix}\cdot \begin{bmatrix}D_1&0\\0&D_2\end{bmatrix}\cdot \begin{bmatrix}0&U^*\\V^*&0\end{bmatrix}$

设 $D_1=diag(\delta_1,\delta_2,...,\delta_{r_1},0,...,0),D_2=diag(\delta_{r_1+1},\delta_{r_1+2},...,\delta_{r_1+r_2},0,...,0)$ ，存在行列变换矩阵 $P_{2n\times 2n},Q_{2n\times 2n}$ 使得 $P\cdot\begin{bmatrix}D_1&0\\0&D_2\end{bmatrix}\cdot Q=D=diag(\delta_1,\delta_2,...,\delta_{r_1+r_2},0,...,0)$

由于该行列变换只涉及行列交换运算，因此 $P, Q$ 是酉矩阵（证明略）

令 $U_C=\begin{bmatrix}U&0\\0&V\end{bmatrix}\cdot P^{-1},V_C^*=Q^{-1}\cdot\begin{bmatrix}0&U^*\\V^*&0\end{bmatrix}$

$\Rightarrow C=U_C\cdot D\cdot V_C^*$