【矩阵论】6.总结2

最新推荐文章于 2024-08-02 11:19:23 发布

pp猪经纪人

最新推荐文章于 2024-08-02 11:19:23 发布

阅读量359

点赞数 5

分类专栏：矩阵论文章标签：矩阵

本文链接：https://blog.csdn.net/weixin_42438398/article/details/138848783

版权

矩阵论专栏收录该内容

9 篇文章 0 订阅

订阅专栏

6. 总结2

4. 矩阵分解两个矩阵 LU分解 QR分解满秩分解奇异值分解

LU 分解（Gauss消去法，待定系数法）

在 Gauss 消去过程中有
$\mathbf{A}=\mathbf{L}_1^{-1}\mathbf{L}_2^{-1}\cdotp\cdotp\cdotp\mathbf{L}_{n-1}^{-1}\mathbf{A}^{(n)}.$ $\boldsymbol{L}_i^{-1}=\begin{bmatrix}1&&&&&\\&\ddots&&&&\\&&1&&&\\&&l_{i+1,i}&1&&\\&&\dots&&\ddots&\\&&l_{n,i}&&&1\end{bmatrix},\quad i=1,2,\cdots,n-1$

记 $L=L_1^{-1}L_2^{-1}...L_{n-1}^{-1}$ 是单位下三角矩阵， $U=A^{(n)}$ 是一个上三角矩阵，则有 $A = LU$ .

Doolittle 分解充要条件 $A$ 的各阶顺序主子阵均不为零.

1.Doolittle 分解 $A = LU$ , 这里 $L$ 是单位下三角矩阵， $U$ 是上三角矩阵

2.Crout 分解 $A = LU$ , 这里 $L$ 是下三角矩阵， $U$ 是单位上三角矩阵.

3.LDU 分解 $A = L D U$ , 这里 $L$ 是单位下三角矩阵， $D$ 是对角矩阵， $U$ 是单位上三角矩阵.

尽管矩阵的三角分解不唯一，但是矩阵所有顺序主子式均不等于零时，这三种三角分解具有唯一性。

例 6.1 已知 $\mathbf{A}=\begin{bmatrix}2&3&4\\-2&0&2\\2&-3&-3\end{bmatrix},$ 计算矩阵 $A$ 的 Doolittle 分解（Gauss消去法，待定系数法）
解初等变换 $\boldsymbol{L}_1=\begin{bmatrix}1&0&0\\1&1&0\\-1&0&1\end{bmatrix},\quad\boldsymbol{L}_1\boldsymbol{A}=\begin{bmatrix}2&3&4\\0&3&6\\0&-6&-7\end{bmatrix}$
同理 $\boldsymbol{L}_{2}=\begin{bmatrix}1&0&0\\0&1&0\\0&2&1\end{bmatrix},\quad\boldsymbol{L}_{2}\boldsymbol{L}_{1}\boldsymbol{A}=\begin{bmatrix}2&3&4\\0&3&6\\0&0&5\end{bmatrix}$
则 $\boldsymbol{L}=\boldsymbol{L}_{1}^{-1}\boldsymbol{L}_{2}^{-1}=\begin{bmatrix}1&0&0\\-1&1&0\\1&-2&1\end{bmatrix},\boldsymbol{U}=\begin{bmatrix}2&3&4\\0&3&6\\0&0&5\end{bmatrix}$

Cholesky 分解(对称正定矩阵) （待定系数法）

若 $A\in\mathbf{R}^{n\times n}$ 为对称正定矩阵，则存在唯一的对角元素均为正的下三角矩阵 $G$ , 使得 $A=GG^\mathrm{T}$ , 这样的分解称为对称正定矩阵的 Cholesky 分解.

例 6.3 计算矩阵 A 的 Choleskey 分解 , $\mathbf{A}=\begin{bmatrix}4&2&-2\\2&2&-3\\-2&-3&14\end{bmatrix}.$
解设 A 的 Choleskey 矩阵分解 $A=\boldsymbol{GG}^{\mathrm{T}}$ , 其中 $\boldsymbol{G}=\begin{bmatrix}g_{11}&0&0\\g_{21}&g_{22}&0\\g_{31}&g_{32}&g_{33}\end{bmatrix}.$
根据计算， $\begin{aligned} &g_{11} =\sqrt{4}=2;\quad g_{21}=2/2=1;\quad g_{31}=-2/2=1, \\ &g_{22} =\sqrt{2-1}=1;\quad g_{32}=-2, \\ &g_{33} =\sqrt{14-1-4}=3. \\ \end{aligned}$ 由此可得 $\mathbf{G}=\begin{bmatrix}2&&\\1&1&\\-1&-2&3\end{bmatrix}.$

正交三角分解（QR分解）

正交矩阵 $QQ^\mathrm{T}=Q^\mathrm{T}Q=E$
正交矩阵的性质： $(1)\:Q^{-1}=Q^{\mathrm{T}}\:;$ $(2)\:\det(Q)=\pm1\:;$ $(3) Q x$ 的长度与 $x$ 的长度相等.
反射矩阵( Householder 变换)设 $w\in\mathbf{R}^n$ , 且 $w\|_2=1$ , 则 $P=I-2ww^\mathrm{T}$ 称为 Householder 变换

给定矩阵 $A\in\mathbf{R}^{n\times n}$ , 若存在 正交矩阵 $Q\in\mathbb{R}^{n\times n}$ 和 上三角矩阵 $R\in\mathbf{R}^{n\times n}$ 使得 $A = QR$ , 这种分解称为矩阵的一个正交三角分解，又称 $QR$ 分解 .

例用 Gram-Schmidt 正交化过程 计算矩阵 $A$ 的正交三角分解. $\mathbf{A}=\begin{pmatrix}2&-2&-1\\2&7&2\\1&8&7\end{pmatrix}.$
解令矩阵 $A=(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_3)$ , 证 3 个 $n$ 阶向量 $\alpha_1,\alpha_2,\alpha_3$ 线性无关，

$\begin{aligned} &\beta_1=\frac{{\alpha}_1}{||\alpha_{1}||_{2}}=(\frac{2}{3}~~\frac{2}{3}~~\frac{1}{3})^T \\ & \hat\beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{|\beta_1|^2}\beta_1=\begin{bmatrix}-6\\3\\6\end{bmatrix} , \beta_2=\frac{ \hat\beta_2}{ \hat\beta_2}=(-\frac{2}{3}~~\frac{1}{3}~~\frac{2}{3})^T\\ & \hat\beta_{3}=\alpha_{3}-\frac{(\alpha_{3},\beta_{2})}{|\beta_{2}|^{2}}\beta_{2}-\frac{(\alpha_{3},\beta_{1})}{|\beta_{1}|^{2}}\beta_{1}=\begin{bmatrix}1\\-2\\2\end{bmatrix}, \beta_3=\frac{ \hat\beta_3}{ \hat\beta_3}=(\frac{1}{3}~~-\frac{2}{3}~~\frac{2}{3})^T \\ \end{aligned}$
用 Schmidt 正交化方法可构造 $Q=(\beta_1,\beta_2,\beta_3)$ , 可知 $Q^HQ=I$ 。而 $R=Q^HA$ 。

或者 $(\alpha_1,\:\alpha_2,\:\alpha_3)=(q_1,\:q_2,\:q_3)\begin{pmatrix}r_{11}&r_{12}&r_{13}\\0&r_{22}&r_{23}\\0&0&r_{33}\end{pmatrix},$ 即 $\begin{aligned} &\alpha_1=r_{11}\boldsymbol q_1,\\ &{\alpha}_2=r_{12}\boldsymbol{q}_1+r_{22}\boldsymbol{q}_2, \\ &\alpha_{3}=r_{13}\boldsymbol{q}_{1}+r_{23}\boldsymbol{q}_{2}+r_{33}\boldsymbol{q}_{3}. \\ \end{aligned}$
经计算, 有 $\begin{aligned}&r_{11}=||\alpha_{1}||_{2}=\sqrt{2^{2}+2^{2}+1^{2}}=3, \boldsymbol{q}_1=\frac{{\alpha}_1}{||\alpha_{1}||_{2}}=(\frac{2}{3}~~\frac{2}{3}~~\frac{1}{3})^T\\ &r_{12}=(\boldsymbol{\alpha}_2,\boldsymbol{q}_1)=6, \bar{\boldsymbol{q}}_2=\boldsymbol{\alpha}_2-r_{12}\boldsymbol{q}_1=\begin{bmatrix}-6\\3\\6\end{bmatrix} , r_{22}=||\bar{\boldsymbol{q}}_{2}||_{2}=9,\boldsymbol{q}_2=\frac{\boldsymbol{\bar{q}}_2}{r_{22}}=\begin{bmatrix}-\frac{2}{3}\\\frac{1}{3}\\\frac{2}{3}\end{bmatrix}.\\. \end{aligned}$
同理最后可得 $\boldsymbol{Q}=\dfrac{1}{3}\begin{bmatrix}2&-2&1\\2&1&-2\\1&2&2\end{bmatrix},\quad\boldsymbol{R}=\begin{bmatrix}3&6&3\\0&9&6\\0&0&3\end{bmatrix}.$

满秩分解

高低分解
设 $\mathbf A\in\mathbb{R}^{m\times n}$ 且 $\mathrm{rank}(\mathbf A)=r\leqslant\min\{m,n\}$ , 则可将 $\mathbf A$ 作满秩分解 $\mathbf {A=CD}$
其中， $\mathbf C\in\mathbb{R}^{m\times r},\mathbf D\in\mathbb{R}^{r\times n}\:$ , 且 $\mathrm{rank}(\mathbf{C})=\mathrm{rank}(\mathbf{D})=r\:.$

例 3.3.2 $\begin{aligned}&A=(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_3,\boldsymbol{\alpha}_4,\boldsymbol{\alpha}_5)=\begin{bmatrix}2&1&6&1&0\\3&2&10&1&0\\2&3&10&-1&3\\4&4&16&0&1\end{bmatrix}\end{aligned}$ ，求矩阵 $A$ 的满秩分解 .
解先用行初等变换把矩阵 $A$ 化为简化阶梯形 $\begin{vmatrix}1&0&2&1&0\\0&1&2&-1&0\\0&0&0&0&1\\0&0&0&0&0\\\end{vmatrix}=(\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\boldsymbol{\beta}_3,\boldsymbol{\beta}_4,\boldsymbol{\beta}_5)=\begin{pmatrix}\boldsymbol{D}\\\boldsymbol{O}\end{pmatrix}$ , 其中， $\boldsymbol{D}=\begin{bmatrix}1&0&2&1&0\\0&1&2&-1&0\\0&0&0&0&1\end{bmatrix}$ 是 $3 \times 5$ 行满秩阵.显然 $\beta_1,\beta_2,\beta_5$ 线性无关，且 $p_3=2\boldsymbol{\beta}_1+2\boldsymbol{\beta}_2,\boldsymbol{\beta}_4=\boldsymbol{\beta}_1-\boldsymbol{\beta}_2$ .由于行初等变换保持矩阵列向量组的线性组合关系，因此 $\alpha_1,\alpha_2,\alpha_5$ 线性无关，且 $\boldsymbol{\alpha}_3=2\boldsymbol{\alpha}_1+2\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_4=\boldsymbol{\alpha}_1-\boldsymbol{\alpha}_2$ . 取 $\boldsymbol C=(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\boldsymbol{\alpha}_5)=\begin{vmatrix}2&1&0\\3&2&0\\2&3&3\\4&4&1\end{vmatrix}$ , 显然 $C$ 是 $4 \times 3$ 列满秩阵，
且满足 $\begin{aligned} \boldsymbol{CD} &=(\boldsymbol{\alpha}_{1}\:,\:\boldsymbol{\alpha}_{2}\:,\:\boldsymbol{\alpha}_{5}\:)\:\begin{bmatrix}1&0&2&1&0\\0&1&2&-1&0\\0&0&0&0&1\end{bmatrix} \\ &=(\alpha_1,\alpha_2,2\alpha_1+2\alpha_2,\alpha_1-\alpha_2,\alpha_5) \\ &=(\alpha_1,\alpha_2,\alpha_3,\alpha_4,\alpha_5)\\ &=\mathbf{A} \end{aligned}$

谱分解

给定矩阵 $\boldsymbol A\in\mathbb{R}^{n\times n}$ 是一个正规矩阵，若存在可逆矩阵 $\boldsymbol P\in\mathbb{R}^{n\times n}$ 和对角矩阵 $\boldsymbol{\Lambda}=\operatorname{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\in\mathbf{R}^{n\times n}$ 使得 $A=P\Lambda P^{-1}\:,$ 这种分解称为矩阵 $\boldsymbol A$ 的一个谱分解.

定义 3.4.1 设矩阵 $\boldsymbol A\in\mathbb{C}^{n\times n}$ , 若 $\boldsymbol{AA^{\mathrm{H}}=A^{\mathrm{H}}A}$ , 则称 $\boldsymbol A$ 为 正规矩阵.

定理 3.4.2 设矩阵 $\boldsymbol A\in\mathbb{C}^{n\times n}$ ,则 $\boldsymbol A$ 是正规矩阵当且仅当 $\boldsymbol A$ 有 $n$ 个两两正交的单位特征向量。

证首先 $\lambda _{1}X$ 可得 $A^{H}X= \overline {\lambda }_{1}X$ .
引理1： $AX=0\Leftrightarrow||AX||=0\Leftrightarrow X^{H}AA^{H}X=0\Leftrightarrow A^{H}X=0$
引理2：若 $A$ 正规 $AX=\lambda X\Rightarrow A^{H}X=\overline{\lambda}X$
只需证 $\lambda I) ^HX= 0$ ,
由 $\lambda I) X= 0\Rightarrow\left((A-\lambda I)X\right)^H(A-\lambda I)X=0\Rightarrow X^H(A-\lambda I)^H(A-\lambda I)X=0$
由于 $A-\lambda I$ 正规， $\lambda I) ^H( A- \lambda I) = ( A- \lambda I) ( A- \lambda I) ^H$
即有 $X^H((A-\lambda I)^H)^H(A-\lambda I)^HX=0$
$\Rightarrow((A-\lambda I)^HX)^H(A-\lambda I)^HX=|(A-\lambda I)^HX|^2=0$
$\Rightarrow(A-\lambda I)^HX=0\Rightarrow(A^H-\overline{\lambda}I)X=0\Rightarrow A^HX=\overline{\lambda}X$
故结论得证，若 $A$ 正规，则 $AX=\lambda X\Longleftrightarrow A^HX=\overline{\lambda}X$
其中，若 $\lambda(A)=\{\lambda_1,\cdots,\lambda_n\}$ ,则 $\lambda(A^H)=\{\overline{\lambda_1},\cdots,\overline{\lambda_n}\}$
下证 $Ax=\lambda_{1}x,Ay=\lambda_{2}y$ ， $x^{H}y=0$
$y^{H}Ax=y^{H}\lambda_1x=\lambda_1y^{H}x$
$A^Hy)^{H}x$ $=(\overline{\lambda}_2y)^{H}x$ $=(\overline{\lambda}_2y)^{H}x$
$=\lambda_{2}y^{H}x$

例 3.4.6 设 $\mathbf{A}=\left[\begin{array}{ccc}4&-6&0\\2&-3&0\\-2&3&2\end{array}\right]$ , 求 $\mathbf{A}$ 的谱分解.
先求 $\mathbf{A}$ 的特征值和特征向量. $\mid\lambda E-A\mid=$ $=\lambda(\lambda-2)\left(\lambda-1\right)$ , 因此， $\mathbf{A}$ 有3个不同的特征值 $\lambda_1=0,\lambda_2=1,\lambda_3=2$ , 故 $\mathbf{A}$ 可对角化，从而 $\mathbf{A}$ 的谱分解一定存在.容易求出它们对应的特征向量为
$p_{1}=(3,\:2,\:0)^{\mathrm{T}},\quad p_{2}=(2,\:1,\:1)^{\mathrm{T}},\quad p_{3}=(0,\:0,\:1)^{\mathrm{T}}.$ 令 $\boldsymbol P=(p_1,p_2,p_3)=\begin{bmatrix}3&2&0\\[0.3em]2&1&0\\[0.3em]0&1&1\end{bmatrix}$ ，显然 , $P$ 可逆,且易求得 $\boldsymbol{P}^{-1}=\begin{pmatrix}\boldsymbol{\beta}_{1}^{\mathrm{T}}\\\boldsymbol{\beta}_{2}^{\mathrm{T}}\\\boldsymbol{\beta}_{3}^{\mathrm{T}}\end{pmatrix}=\begin{pmatrix}-1&2&0\\2&-3&0\\-2&3&1\end{pmatrix}$ 。
这样有
$\begin{aligned} &\boldsymbol{A}=\boldsymbol{P}\begin{pmatrix}0&&\\&1&\\&&2\end{pmatrix}\boldsymbol{P}^{-1}=(\boldsymbol{p}_1,\boldsymbol{p}_2,\boldsymbol{p}_3)\begin{pmatrix}0&&\\&1&\\&&2\end{pmatrix}\begin{pmatrix}\boldsymbol{\beta}_1^\mathrm{T}\\\boldsymbol{\beta}_2^\mathrm{T}\\\boldsymbol{\beta}_3^\mathrm{T}\end{pmatrix}=p_2\beta_2^\mathrm{T}+2p_3\beta_3^\mathrm{T}, \end{aligned}$

奇异值分解

设 $\boldsymbol A\in\mathbf{R}^{m\times n}$ , 半正定矩阵 $\boldsymbol {A^\mathrm{T}A}$ 的 $n$ 个特征值记为 $\lambda_i,i=1,2,...,n$ , 显然 $\lambda_i\geqslant0$ . 称 $\lambda_i$ 的算术平方根 $\sigma_i=\sqrt{\lambda_i}$ ( $i = 1, 2, ..., n)$ 为矩阵 $\boldsymbol A$ 的 奇异值.

定理 3.5.2 (奇异值分解定理) 设矩阵 $\boldsymbol A\in\mathbf{R}^{m\times n}$ 的奇异值中有 $r$ 个不等于零，记为 $\sigma_1\geqslant$ $\sigma_2\geq\cdots\geq\sigma_r>0.$ 它们构成的 $r$ 阶对角阵记为 $D=\operatorname{diag}\{\sigma_1,\sigma_2,\cdots,\sigma_r\}$ . 令 $m\times n$ 阶矩阵 $\boldsymbol{\Sigma}=\binom{\boldsymbol{D~O}}{\boldsymbol{O~O}}$ , 则存在正交矩阵 $\boldsymbol U\in\mathbb{R}^{m\times m},\:\boldsymbol V\in\mathbb{R}^{n\times n}$ ,使
$A=\boldsymbol U\boldsymbol{\Sigma}\boldsymbol V^{\mathrm{T}}.$

例 6.10 求矩阵 $\mathbf{A}=\begin{bmatrix}1&1\\[0.3em]1&-2\\[0.3em]2&1\end{bmatrix}$ 的奇异值分解.
解 $\mathbf{A}^\mathrm{T}\mathbf{A}=\left[\begin{matrix}6&1\\1&6\end{matrix}\right],$ 其特征值为 $\lambda_1=7,\lambda_2=5$ 奇异值为 $\sigma_{1}=\sqrt{7},\sigma_{2}=\sqrt{5}$
$A^{\mathrm{T}}A$ 的正交单位特征向量为 $\begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\end{bmatrix},\quad\begin{bmatrix}\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}\end{bmatrix}.$ 于是
$\begin{aligned} &\boldsymbol{D}=\begin{bmatrix}\sqrt{7}&0\\0&\sqrt{5}\end{bmatrix},\quad\boldsymbol{V}=\boldsymbol{V}^\mathrm{T}=\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\[0.3em]\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\end{bmatrix}, \\ &\boldsymbol{U}_1=\boldsymbol{A}\boldsymbol{V}^{-1}\boldsymbol{D}^{-1}=\begin{bmatrix}1&1\\1&-2\\2&1\end{bmatrix}\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\end{bmatrix}\begin{bmatrix}\frac{1}{\sqrt{7}}&0\\0&-\frac{1}{\sqrt{5}}\end{bmatrix} =\begin{bmatrix}\frac{2}{\sqrt{14}}&0\\\\-\frac{1}{\sqrt{14}}&\frac{3}{\sqrt{10}}\\\\\frac{3}{\sqrt{14}}&\frac{1}{\sqrt{10}}\end{bmatrix}, \end{aligned}$
$\begin{aligned} &解线性方程组 \begin{cases}2x_1-x_2+3x_3=0,\\[2ex]3x_2+x_3=0,\end{cases} 得通解为 ~\boldsymbol{x}=\left(\begin{matrix}{x_{1}}\\\\{x_{2}}\\\\{x_{3}}\\\end{matrix}\right)=k\left(\begin{matrix}{5}\\{1}\\{-3}\\\end{matrix}\right), \text{取 }k=\frac{1}{\sqrt{35}},\\ &\text{得 }x\text{为单位向量}.\text{于是}~\boldsymbol{U}=\begin{bmatrix}\frac{2}{\sqrt{14}}&0&\frac{5}{\sqrt{35}}\\\\-\frac{1}{\sqrt{14}}&\frac{3}{\sqrt{10}}&\frac{1}{\sqrt{35}}\\\\\frac{3}{\sqrt{14}}&\frac{1}{\sqrt{10}}&-\frac{3}{\sqrt{35}}\end{bmatrix} \boldsymbol{\Sigma}=\begin{bmatrix}\sqrt{7}&0\\\\0&\sqrt{5}\\\\0&0\end{bmatrix}. 容易验证此时 ~U\Sigma V^{\mathrm{T}} =A. \end{aligned}$

pp猪经纪人

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【矩阵论】6.总结2

6. 总结24. 矩阵分解两个矩阵 LU分解 QR分解满秩分解奇异值分解LU 分解（Gauss消去法，待定系数法）在 Gauss 消去过程中有A=L1−1L2−1⋅⋅⋅Ln−1−1A(n).\mathbf{A}=\mathbf{L}_1^{-1}\mathbf{L}_2^{-1}\cdotp\cdotp\cdotp\mathbf{L}_{n-1}^{-1}\mathbf{A}^{(n)}.A=L1−1L2−1⋅⋅⋅Ln−1−1A(n). Li−1=[1⋱1li+1,i1…⋱ln,i
复制链接

扫一扫