正交矩阵,(标准)正交基,正交投影,正交分解定理,最佳逼近定理,格拉姆-施密特方法求正交基(手算+MATLAB),QR分解(手算+MATLAB计算、分析)

正交(orthogonality)、正交集(orthogonal set)、单位正交集

定义:如果向量 u u u和向量 v v v是相互正交的,则有: u ⋅ v = 0 u\cdot v=0 uv=0

因为对于零向量,都有 0 T ⋅ v = 0 0^T\cdot v=0 0Tv=0,所以零向量与 R n R^n Rn中任意向量正交。

(零向量的默认形式写作 0 = [ 0 0 ⋮ 0 ] 0=\begin{bmatrix}0\\0\\\vdots\\0\end{bmatrix} 0=000

R n R^n Rn中的向量集合{ u 1 u_1 u1 … \dots u p u_p up}中的任意两个不同的向量都正交,则此集合称为正交集

如果正交集里面的向量都是单位向量(即长度都为1的向量),则此集合称为单位正交集

如果单位正交集{ u 1 u_1 u1 … \dots u p u_p up}生成子空间H,则{ u 1 u_1 u1 … \dots u p u_p up}是H的单位正交基

最简单的单位正交集是由 R n R^n Rn中的标准基组成的集合 { e 1 , e 2 , … , e n } \{e_1,e_2,\dots,e_n\} {e1,e2,,en},集合 { e 1 , e 2 , … , e n } \{e_1,e_2,\dots,e_n\} {e1,e2,,en}的任一非空子集也是单位正交的。

u 1 = [ 3 1 1 ] u_1=\begin{bmatrix}3\\1\\1\end{bmatrix} u1=311 u 2 = [ − 1 2 1 ] u_2=\begin{bmatrix}-1\\2\\1\end{bmatrix} u2=121 u 3 = [ − 1 2 − 2 7 2 ] u_3=\begin{bmatrix}-\frac{1}{2}\\-2\\\frac{7}{2}\end{bmatrix} u3=21227

因为 u 1 ⋅ u 2 = 0 u_1\cdot u_2=0 u1u2=0 u 2 ⋅ u 3 = 0 u_2\cdot u_3=0 u2u3=0 u 1 ⋅ u 3 = 0 u_1\cdot u_3=0 u1u3=0,所以集合{ u 1 u_1 u1 u 2 u_2 u2 u 3 u_3 u3}是正交集。

如果 S = { u 1 , … , u p } S=\{u_1,\dots ,u_p\} S={u1,,up}是由 R n R^n Rn中非零向量构成的正交集,则S是线性无关的集合,所以 S = { u 1 , … , u p } S=\{u_1,\dots ,u_p\} S={u1,,up}是其所生成的子空间H的一组基。当然,反过来说也成立,即: R n R^n Rn中子空间H的一个正交基不仅是H的一个基,同时也是一个正交集。

定理1:

{ u 1 , … , u p } \{u_1,\dots ,u_p\} {u1,,up}是由 R n R^n Rn中子空间H的正交基,对H中每个向量 y y y,线性组合 y = c 1 u 1 + ⋯ + c p u p y=c_1u_1+\dots +c_pu_p y=c1u1++cpup中的权可以用公式 c j = y ⋅ u j u j ⋅ u j c_j=\frac{y\cdot u_j}{u_j\cdot u_j} cj=ujujyuj来计算。

u 1 = [ 3 1 1 ] u_1=\begin{bmatrix}3\\1\\1\end{bmatrix} u1=311 u 2 = [ − 1 2 1 ] u_2=\begin{bmatrix}-1\\2\\1\end{bmatrix} u2=121 u 3 = [ − 1 2 − 2 7 2 ] u_3=\begin{bmatrix}-\frac{1}{2}\\-2\\\frac{7}{2}\end{bmatrix} u3=21227

由上述例子可知集合{ u 1 u_1 u1 u 2 u_2 u2 u 3 u_3 u3}是正交集,所以也是 R 3 R^3 R3中的一个正交基。请将 y = [ 6 1 − 8 ] y=\begin{bmatrix}6\\1\\-8\end{bmatrix} y=618表示成为S中向量的线性组合。

解:
y ⋅ u 1 = 18 + 1 − 8 = 11 y\cdot u_1=18+1-8=11 yu1=18+18=11 u 1 ⋅ u 1 = 9 + 1 + 1 = 11 u_1\cdot u_1=9+1+1=11 u1u1=9+1+1=11
y ⋅ u 2 = − 6 + 2 − 8 = − 12 y\cdot u_2=-6+2-8=-12 yu2=6+28=12 u 2 ⋅ u 2 = 1 + 4 + 1 = 6 u_2\cdot u_2=1+4+1=6 u2u2=1+4+1=6
y ⋅ u 3 = − 3 − 2 − 28 = − 33 y\cdot u_3=-3-2-28=-33 yu3=3228=33 u 3 ⋅ u 3 = 1 4 + 4 + 49 4 = 33 2 u_3\cdot u_3=\frac{1}{4}+4+\frac{49}{4}=\frac{33}{2} u3u3=41+4+449=233

由上述定理得:

y = y ⋅ u 1 u 1 ⋅ u 1 ⋅ u 1 + y ⋅ u 2 u 2 ⋅ u 2 ⋅ u 2 + y ⋅ u 3 u 3 ⋅ u 3 ⋅ u 3 = 11 11 u 1 + − 12 6 u 2 + − 33 33 2 u 3 = u 1 − 2 u 2 − 2 u 3 y=\frac{y\cdot u_1}{u_1\cdot u_1}\cdot u_1+\frac{y\cdot u_2}{u_2\cdot u_2}\cdot u_2+\frac{y\cdot u_3}{u_3\cdot u_3}\cdot u_3=\frac{11}{11}u_1+\frac{-12}{6}u_2+\frac{-33}{\frac{33}{2}}u_3=u_1-2u_2-2u_3 y=u1u1yu1u1+u2u2yu2u2+u3u3yu3u3=1111u1+612u2+23333u3=u12u22u3

总结:由正交基构成的线性表示,如 y = u 1 − 2 u 2 − 2 u 3 y=u_1-2u_2-2u_3 y=u12u22u3,其中的权( u 1 u_1 u1 u 2 u_2 u2 u 3 u_3 u3前面的数)是较容易由公式算出的。但是如果基不是正交的,则不能用上述公式计算权值,而要用解方程组,然后表示成参数向量形式的方式写出线性表示的式子。

定理2:

一个 m × n m\times n m×n的矩阵 U U U具有单位正交列向量的充要条件是 U T U = I U^TU=I UTU=I。(这个矩阵 U U U如果满足此条件,也叫正交矩阵

例:矩阵 U = [ 1 2 2 3 1 2 − 2 3 0 1 3 ] U=\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{2}{3}\\\frac{1}{\sqrt{2}}&-\frac{2}{3}\\0&\frac{1}{3}\end{bmatrix} U=2 12 10323231

对于矩阵 U U U的任两列:
[ 1 2 1 2 0 ] T [ 2 3 − 2 3 1 3 ] = 2 3 − 2 3 + 0 = 0 \begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\\0\end{bmatrix}^T \begin{bmatrix}\frac{2}{3}\\-\frac{2}{3}\\\frac{1}{3}\end{bmatrix}=\frac{\sqrt{2}}{3}-\frac{\sqrt{2}}{3}+0=0 2 12 10T323231=32 32 +0=0,正交。

且每列的(即向量的长度,或叫范数)等于1,所以此矩阵具有单位正交列向量。

计算:

U T U = [ 1 2 1 2 0 2 3 − 2 3 1 3 ] [ 1 2 2 3 1 2 − 2 3 0 1 3 ] = [ 1 0 0 1 ] = I U^TU=\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}&0\\\frac{2}{3}&-\frac{2}{3}&\frac{1}{3}\end{bmatrix} \begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{2}{3}\\\frac{1}{\sqrt{2}}&-\frac{2}{3}\\0&\frac{1}{3}\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix}=I UTU=[2 1322 132031]2 12 10323231=[1001]=I

所以,也可以推出此矩阵具有单位正交列向量。

定理3:

如果矩阵 U U U是一个 m × n m\times n m×n的且具有单位正交列的矩阵,且 x x x y y y R n R^n Rn中的向量,则:

  1. ∣ ∣ U x ∣ ∣ = ∣ ∣ x ∣ ∣ ||Ux||=||x|| Ux=x
  2. ( U x ) ⋅ ( U y ) = x ⋅ y (Ux)\cdot (Uy)=x\cdot y (Ux)(Uy)=xy
  3. ( U x ) ⋅ ( U y ) = 0 (Ux)\cdot (Uy)=0 (Ux)(Uy)=0的充要条件是 x ⋅ y = 0 x\cdot y=0 xy=0.

例:对于上面的矩阵 U = [ 1 2 2 3 1 2 − 2 3 0 1 3 ] U=\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{2}{3}\\\frac{1}{\sqrt{2}}&-\frac{2}{3}\\0&\frac{1}{3}\end{bmatrix} U=2 12 10323231,和 x = [ 2 3 ] x=\begin{bmatrix}\sqrt{2}\\3\end{bmatrix} x=[2 3],。

由于矩阵 U U U具有单位正交列向量,则:

U x = [ 1 2 2 3 1 2 − 2 3 0 1 3 ] [ 2 3 ] = [ 3 − 1 1 ] Ux=\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{2}{3}\\\frac{1}{\sqrt{2}}&-\frac{2}{3}\\0&\frac{1}{3}\end{bmatrix}\begin{bmatrix}\sqrt{2}\\3\end{bmatrix}=\begin{bmatrix}3\\-1\\1\end{bmatrix} Ux=2 12 10323231[2 3]=311

∣ ∣ U x ∣ ∣ = 9 + 1 + 1 = 11 ||Ux||=\sqrt{9+1+1}=\sqrt{11} Ux=9+1+1 =11
∣ ∣ x ∣ ∣ = 2 + 9 = 11 ||x||=\sqrt{2+9}=\sqrt{11} x=2+9 =11

∣ ∣ U x ∣ ∣ = ∣ ∣ x ∣ ∣ ||Ux||=||x|| Ux=x

总结

  1. 如果一个矩阵 U U U可逆,且 U − 1 = U T U^{-1}=U^T U1=UT,则矩阵 U U U正交矩阵(orthogonal matrix)。这样的矩阵具有单位正交列。
  2. 任何具有单位正交列的方阵都是正交矩阵。
  3. 正交矩阵的每两行也都是单位正交的。

例:
矩阵 U = [ 3 11 − 1 6 − 1 66 1 11 2 6 − 4 66 1 11 1 6 7 66 ] U=\begin{bmatrix}\frac{3}{\sqrt{11}}&-\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{66}}\\\frac{1}{\sqrt{11}}&\frac{2}{\sqrt{6}}&-\frac{4}{\sqrt{66}}\\\frac{1}{\sqrt{11}}&\frac{1}{\sqrt{6}}&\frac{7}{\sqrt{66}}\end{bmatrix} U=11 311 111 16 16 26 166 166 466 7

先考察其每两列:

[ 3 11 1 11 1 11 ] T [ − 1 6 2 6 1 6 ] = − 3 66 + 2 66 + 1 66 = 0 \begin{bmatrix}\frac{3}{\sqrt{11}}\\\frac{1}{\sqrt{11}}\\\frac{1}{\sqrt{11}}\end{bmatrix}^T\begin{bmatrix}-\frac{1}{\sqrt{6}}\\\frac{2}{\sqrt{6}}\\\frac{1}{\sqrt{6}}\end{bmatrix}=-\frac{3}{\sqrt{66}}+\frac{2}{\sqrt{66}}+\frac{1}{\sqrt{66}}=0 11 311 111 1T6 16 26 1=66 3+66 2+66 1=0

[ 3 11 1 11 1 11 ] T [ − 1 66 − 4 66 7 66 ] = − 3 11 × 66 − 4 11 × 66 + 7 11 × 66 = 0 \begin{bmatrix}\frac{3}{\sqrt{11}}\\\frac{1}{\sqrt{11}}\\\frac{1}{\sqrt{11}}\end{bmatrix}^T\begin{bmatrix}-\frac{1}{\sqrt{66}}\\-\frac{4}{\sqrt{66}}\\\frac{7}{\sqrt{66}}\end{bmatrix}=-\frac{3}{\sqrt{11\times 66}}-\frac{4}{\sqrt{11\times 66}}+\frac{7}{\sqrt{11\times 66}}=0 11 311 111 1T66 166 466 7=11×66 311×66 4+11×66 7=0

[ − 1 6 2 6 1 6 ] T [ − 1 66 − 4 66 7 66 ] = 1 6 × 66 − 8 6 × 66 + 7 6 × 66 = 0 \begin{bmatrix}-\frac{1}{\sqrt{6}}\\\frac{2}{\sqrt{6}}\\\frac{1}{\sqrt{6}}\end{bmatrix}^T\begin{bmatrix}-\frac{1}{\sqrt{66}}\\-\frac{4}{\sqrt{66}}\\\frac{7}{\sqrt{66}}\end{bmatrix}=\frac{1}{\sqrt{6\times 66}}-\frac{8}{\sqrt{6\times 66}}+\frac{7}{\sqrt{6\times 66}}=0 6 16 26 1T66 166 466 7=6×66 16×66 8+6×66 7=0

矩阵 U U U的每两列都正交,且每列模为1,所以矩阵 U U U具有单位正交列,所以矩阵 U U U是正交矩阵。

再考察其每两行:
[ 3 11 − 1 6 − 1 66 ] [ 1 11 2 6 − 4 66 ] T = 18 66 − 22 66 + 4 66 = 0 \begin{bmatrix}\frac{3}{\sqrt{11}}&-\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{66}}\end{bmatrix} \begin{bmatrix}\frac{1}{\sqrt{11}}&\frac{2}{\sqrt{6}}&-\frac{4}{\sqrt{66}}\end{bmatrix}^T=\frac{18}{66}-\frac{22}{66}+\frac{4}{66}=0 [11 36 166 1][11 16 266 4]T=66186622+664=0

[ 3 11 − 1 6 − 1 66 ] [ 1 11 1 6 7 66 ] T = 18 66 − 11 66 − 7 66 = 0 \begin{bmatrix}\frac{3}{\sqrt{11}}&-\frac{1}{\sqrt{6}}&-\frac{1}{\sqrt{66}}\end{bmatrix} \begin{bmatrix}\frac{1}{\sqrt{11}}&\frac{1}{\sqrt{6}}&\frac{7}{\sqrt{66}}\end{bmatrix}^T=\frac{18}{66}-\frac{11}{66}-\frac{7}{66}=0 [11 36 166 1][11 16 166 7]T=66186611667=0

[ 1 11 2 6 − 4 66 ] [ 1 11 1 6 7 66 ] T = 6 66 + 22 66 − 28 66 = 0 \begin{bmatrix}\frac{1}{\sqrt{11}}&\frac{2}{\sqrt{6}}&-\frac{4}{\sqrt{66}}\end{bmatrix} \begin{bmatrix}\frac{1}{\sqrt{11}}&\frac{1}{\sqrt{6}}&\frac{7}{\sqrt{66}}\end{bmatrix}^T=\frac{6}{66}+\frac{22}{66}-\frac{28}{66}=0 [11 16 266 4][11 16 166 7]T=666+66226628=0

且每行的向量的模也都是1,

所以,可以验证正交矩阵 U U U同样也具有单位正交行。

正交补(Orthocomplement)

如果向量 z z z R n R^n Rn的子空间W中的任意向量都正交,则称 z z z正交于W。
与子空间W正交的向量 z z z的全体组成的集合称为W的正交补

例:直线L垂直于平面W,垂足为O,则L上的所有向量垂直于空间W,所以直线L(向量集合)为W的正交补。反之,W平面空间中所有向量垂直于直线L,所以W也是L空间的正交补。

正交分解定理

若W是 R n R^n Rn的一个子空间,那么 R n R^n Rn中每一个向量 y y y可以唯一表示为: y = y ^ + z y=\hat{y}+z y=y^+z
其中 y ^ \hat{y} y^属于W,而 z z z属于W的正交补(即正交于W的空间)。
如果 { u 1 , u 2 , … , u p } \{u_1,u_2,\dots,u_p\} {u1,u2,,up}是任意正交基,那么:
y ^ = y ⋅ u 1 u 1 ⋅ u 1 u 1 + ⋯ + y ⋅ u p u p ⋅ u p u p \hat{y}=\frac{y\cdot u_1}{u_1\cdot u_1}u_1+\dots +\frac{y\cdot u_p}{u_p\cdot u_p}u_p y^=u1u1yu1u1++upupyupup

z = y − y ^ z=y-\hat{y} z=yy^,其中 y ^ \hat{y} y^ y y y在W上的正交投影,记作 p r o j w y proj_wy projwy。见下图。
在这里插入图片描述

例:
u 1 = [ 2 5 − 1 ] u_1=\begin{bmatrix}2\\5\\-1\end{bmatrix} u1=251 u 2 = [ − 2 1 1 ] u_2=\begin{bmatrix}-2\\1\\1\end{bmatrix} u2=211 y = [ 1 2 3 ] y=\begin{bmatrix}1\\2\\3\end{bmatrix} y=123,将 y y y写成属于W的向量与正交于W的向量之和。

解:

u 1 ⋅ u 2 = 0 u_1\cdot u_2=0 u1u2=0,所以 { u 1 , u 2 } \{u_1,u_2\} {u1,u2} W = S p a n { u 1 , u 2 } W=Span\{u_1,u_2\} W=Span{u1,u2}的正交基。

由正交分解定理得:
先求 y y y在W上的投影:
y ^ = y ⋅ u 1 u 1 ⋅ u 1 u 1 + y ⋅ u 2 u 2 ⋅ u 2 u 2 = 9 30 [ 2 5 − 1 ] + 3 6 [ − 2 1 1 ] = [ − 2 5 2 1 5 ] \hat{y}=\frac{y\cdot u_1}{u_1\cdot u_1}u_1+\frac{y\cdot u_2}{u_2\cdot u_2}u_2=\frac{9}{30}\begin{bmatrix}2\\5\\-1\end{bmatrix}+\frac{3}{6}\begin{bmatrix}-2\\1\\1\end{bmatrix}=\begin{bmatrix}\frac{-2}{5}\\2\\\frac{1}{5}\end{bmatrix} y^=u1u1yu1u1+u2u2yu2u2=309251+63211=52251

再求垂直于W的 z z z z z z属于W的正交补):

z = y − y ^ = [ 1 2 3 ] − [ − 2 5 2 1 5 ] = [ 7 5 0 14 5 ] z=y-\hat{y}=\begin{bmatrix}1\\2\\3\end{bmatrix}-\begin{bmatrix}\frac{-2}{5}\\2\\\frac{1}{5}\end{bmatrix}=\begin{bmatrix}\frac{7}{5}\\0\\\frac{14}{5}\end{bmatrix} z=yy^=12352251=570514

所以,可以得到 y y y的分解式是:

y = [ 1 2 3 ] = [ 7 5 0 14 5 ] + [ − 2 5 2 1 5 ] y=\begin{bmatrix}1\\2\\3\end{bmatrix}=\begin{bmatrix}\frac{7}{5}\\0\\\frac{14}{5}\end{bmatrix}+\begin{bmatrix}\frac{-2}{5}\\2\\\frac{1}{5}\end{bmatrix} y=123=570514+52251

可见,这样分解出来的两个向量一个是属于W的,另一个是正交与W的。

最佳逼近定理

  如果W是 R n R^n Rn的一个子空间, y y y R n R^n Rn中任意向量, y ^ \hat{y} y^ y y y在W上的正交投影,那么 y ^ \hat{y} y^是W中最接近 y y y的点,即有: ∣ ∣ y − y ^ ∣ ∣ < ∣ ∣ y − v ∣ ∣ ||y-\hat{y}||<||y-v|| yy^<yv对所有属于W,但又异于 y ^ \hat{y} y^ v v v都成立。

  这里的 y ^ \hat{y} y^也叫W中的元素对 y y y的最佳逼近。

例如,在上例中,

y y y在W上的投影:
y ^ = y ⋅ u 1 u 1 ⋅ u 1 u 1 + y ⋅ u 2 u 2 ⋅ u 2 u 2 = 9 30 [ 2 5 − 1 ] + 3 6 [ − 2 1 1 ] = [ − 2 5 2 1 5 ] \hat{y}=\frac{y\cdot u_1}{u_1\cdot u_1}u_1+\frac{y\cdot u_2}{u_2\cdot u_2}u_2=\frac{9}{30}\begin{bmatrix}2\\5\\-1\end{bmatrix}+\frac{3}{6}\begin{bmatrix}-2\\1\\1\end{bmatrix}=\begin{bmatrix}\frac{-2}{5}\\2\\\frac{1}{5}\end{bmatrix} y^=u1u1yu1u1+u2u2yu2u2=309251+63211=52251

y ^ \hat{y} y^就是W中距离 y y y最近的点。

由最佳逼近定理可得:从 y y y到W的距离为 ∣ ∣ y − y ^ ∣ ∣ = 49 25 + 196 25 = 49 5 ||y-\hat{y}||=\sqrt{\frac{49}{25}+\frac{196}{25}}=\sqrt{\frac{49}{5}} yy^=2549+25196 =549

y − y ^ = [ 1 2 3 ] − [ − 2 5 2 1 5 ] = [ 7 5 0 14 5 ] y-\hat{y}=\begin{bmatrix}1\\2\\3\end{bmatrix}-\begin{bmatrix}\frac{-2}{5}\\2\\\frac{1}{5}\end{bmatrix}=\begin{bmatrix}\frac{7}{5}\\0\\\frac{14}{5}\end{bmatrix} yy^=12352251=570514

格拉姆-施密特方法(Gram Schmidt method)

方法:对于 R n R^n Rn的子空间W的一个基 { x 1 , x 2 , … , x p } \{x_1,x_2,\dots,x_p\} {x1,x2,,xp},定义:
v 1 = x 1 v_1=x_1 v1=x1
v 2 = x 2 − x 2 ⋅ v 1 v 1 ⋅ v 1 v 1 v_2=x_2-\frac{x_2\cdot v_1}{v_1\cdot v_1}v_1 v2=x2v1v1x2v1v1
v 3 = x 3 − x 3 ⋅ v 1 v 1 ⋅ v 1 v 1 − x 3 ⋅ v 2 v 2 ⋅ v 2 v 2 v_3=x_3-\frac{x_3\cdot v_1}{v_1\cdot v_1}v_1-\frac{x_3\cdot v_2}{v_2\cdot v_2}v_2 v3=x3v1v1x3v1v1v2v2x3v2v2
… \dots
v p = x p − x p ⋅ v 1 v 1 ⋅ v 1 v 1 − x p ⋅ v 2 v 2 ⋅ v 2 v 2 − ⋯ − x p ⋅ v p − 1 v p − 1 ⋅ v p − 1 v p − 1 v_p=x_p-\frac{x_p\cdot v_1}{v_1\cdot v_1}v_1-\frac{x_p\cdot v_2}{v_2\cdot v_2}v_2-\dots -\frac{x_p\cdot v_{p-1}}{v_{p-1}\cdot v_{p-1}}v_{p-1} vp=xpv1v1xpv1v1v2v2xpv2v2vp1vp1xpvp1vp1
{ v 1 , v 2 , … , v p } \{v_1,v_2,\dots,v_p\} {v1,v2,,vp}是W的一个正交基。
此外, S p a n { v 1 , … , v k } = S p a n { x 1 , … , x k } Span\{v_1,\dots ,v_k\}=Span\{x_1,\dots ,x_k\} Span{v1,,vk}=Span{x1,,xk},其中 1 ≤ k ≤ p 1\leq k\leq p 1kp

1:
假设 W = S p a n { x 1 , x 2 } W=Span\{x_1,x_2\} W=Span{x1,x2},其中 x 1 = [ 3 6 0 ] x_1=\begin{bmatrix}3\\6\\0\end{bmatrix} x1=360 x 2 = [ 1 2 2 ] x_2=\begin{bmatrix}1\\2\\2\end{bmatrix} x2=122,构造 W = S p a n { x 1 , x 2 } W=Span\{x_1,x_2\} W=Span{x1,x2}的一个正交基。
在这里插入图片描述

解:

v 1 = x 1 v_1=x_1 v1=x1 p p p x 2 x_2 x2 x 1 x_1 x1上的投影。令 v 2 = x 2 − p v_2=x_2-p v2=x2p为与 x 1 x_1 x1正交的 x 2 x_2 x2的分量, v 2 v_2 v2属于W。

v 2 = x 2 − p = x 2 − x 2 ⋅ x 1 x 1 ⋅ x 1 x 1 = [ 1 2 2 ] − 15 45 [ 3 6 0 ] = [ 0 0 2 ] v_2=x_2-p=x_2-\frac{x_2\cdot x_1}{x_1\cdot x_1}x_1=\begin{bmatrix}1\\2\\2\end{bmatrix}-\frac{15}{45}\begin{bmatrix}3\\6\\0\end{bmatrix}=\begin{bmatrix}0\\0\\2\end{bmatrix} v2=x2p=x2x1x1x2x1x1=1224515360=002

所以 { v 1 , v 2 } \{v_1,v_2\} {v1,v2}是空间W的非零向量构成的正交集,且因为dimW=2,所以 { v 1 , v 2 } \{v_1,v_2\} {v1,v2}是W的一个基,即W的正交基

标准正交基(Orthonormal Basis):

上例中, v 1 = [ 3 6 0 ] v_1=\begin{bmatrix}3\\6\\0\end{bmatrix} v1=360 v 2 = [ 0 0 2 ] v_2=\begin{bmatrix}0\\0\\2\end{bmatrix} v2=002 { v 1 , v 2 } \{v_1,v_2\} {v1,v2}是W的正交基,把它变成标准正交基,即把每个元素单位化即可:
u 1 = v 1 ∣ ∣ v 1 ∣ ∣ = 1 45 [ 3 6 0 ] = [ 1 5 2 5 0 ] u_1=\frac{v_1}{||v_1||}=\frac{1}{\sqrt{45}}\begin{bmatrix}3\\6\\0\end{bmatrix}=\begin{bmatrix}\frac{1}{\sqrt{5}}\\\frac{2}{\sqrt{5}}\\0\end{bmatrix} u1=v1v1=45 1360=5 15 20
u 2 = v 2 ∣ ∣ v 2 ∣ ∣ = 1 4 [ 0 0 2 ] = [ 0 0 1 ] u_2=\frac{v_2}{||v_2||}=\frac{1}{\sqrt{4}}\begin{bmatrix}0\\0\\2\end{bmatrix}=\begin{bmatrix}0\\0\\1\end{bmatrix} u2=v2v2=4 1002=001

{ u 1 , u 2 } \{u_1,u_2\} {u1,u2}是W的标准正交基

例2
x 1 = [ 1 1 1 1 ] x_1=\begin{bmatrix}1\\1\\1\\1\end{bmatrix} x1=1111 x 2 = [ 0 1 1 1 ] x_2=\begin{bmatrix}0\\1\\1\\1\end{bmatrix} x2=0111 x 3 = [ 0 0 1 1 ] x_3=\begin{bmatrix}0\\0\\1\\1\end{bmatrix} x3=0011,请构造 R 4 R^4 R4子空间W的一个正交基。

解:

由于 { x 1 , x 2 , x 3 } \{x_1,x_2,x_3\} {x1,x2,x3}是线性无关的,所以它们构成W的一个基。

先令 v 1 = x 1 v_1=x_1 v1=x1 W 1 = S p a n { x 1 } = S p a n { v 1 } W_1=Span\{x_1\}=Span\{v_1\} W1=Span{x1}=Span{v1}

再取 v 2 v_2 v2等于 x 2 x_2 x2减去它在子空间 W 1 W_1 W1上投影所得的向量,即:
v 2 = x 2 − p v_2=x_2-p v2=x2p为与 x 1 x_1 x1正交的 x 2 x_2 x2的分量, v 2 v_2 v2属于W,且 { v 1 , v 2 } \{v_1,v_2\} {v1,v2}是由 x 1 x_1 x1 x 2 x_2 x2所生成的子空间 W 2 W_2 W2的一个正交基。

v 2 = x 2 − p r o j W 1 x 2 = x 2 − x 2 ⋅ v 1 v 1 ⋅ v 1 v 1 = [ 0 1 1 1 ] − 3 4 [ 1 1 1 1 ] = [ − 3 4 1 4 1 4 1 4 ] v_2=x_2-proj_{W_1}x_2=x_2-\frac{x_2\cdot v_1}{v_1\cdot v_1}v_1=\begin{bmatrix}0\\1\\1\\1\end{bmatrix}-\frac{3}{4}\begin{bmatrix}1\\1\\1\\1\end{bmatrix}=\begin{bmatrix}-\frac{3}{4}\\\frac{1}{4}\\\frac{1}{4}\\\frac{1}{4}\end{bmatrix} v2=x2projW1x2=x2v1v1x2v1v1=0111431111=43414141

当然,可以吧 v 2 v_2 v2的分数放缩成整数:

v 1 = [ 1 1 1 1 ] v_1=\begin{bmatrix}1\\1\\1\\1\end{bmatrix} v1=1111 v 2 ′ = 4 v 2 = [ − 3 1 1 1 ] v_2^{'}=4v_2=\begin{bmatrix}-3\\1\\1\\1\end{bmatrix} v2=4v2=3111

再取 v 3 v_3 v3 x 3 x_3 x3减去它在子空间 W 2 W_2 W2上的投影所得的向量:

先用正交基 { v 1 , v 2 ′ } \{v_1,v_2^{'}\} {v1,v2}计算 x 3 x_3 x3 W 2 W_2 W2上的投影:

p r o j W 2 x 3 = p r o j v 1 x 3 + p r o j v 2 ′ x 3 = x 3 ⋅ v 1 v 1 ⋅ v 1 v 1 + x 3 ⋅ v 2 ′ v 2 ′ ⋅ v 2 ′ v 2 ′ = 2 4 [ 1 1 1 1 ] + 2 12 [ − 3 1 1 1 ] = [ 0 2 3 2 3 2 3 ] proj_{W_2}x_3=proj_{v_1}x_3+proj_{v_2^{'}}x_3= \frac{x_3\cdot v_1}{v_1\cdot v_1}v_1+\frac{x_3\cdot v_2^{'}}{v_2^{'}\cdot v_2^{'}}v_2^{'}=\frac{2}{4}\begin{bmatrix}1\\1\\1\\1\end{bmatrix}+\frac{2}{12}\begin{bmatrix}-3\\1\\1\\1\end{bmatrix}=\begin{bmatrix}0\\\frac{2}{3}\\\frac{2}{3}\\\frac{2}{3}\end{bmatrix} projW2x3=projv1x3+projv2x3=v1v1x3v1v1+v2v2x3v2v2=421111+1223111=0323232

那么 v 3 v_3 v3 x 3 x_3 x3正交于 W 2 W_2 W2的分量,即:

v 3 = x 3 − p r o j W 2 x 3 = [ 0 0 1 1 ] − [ 0 2 3 2 3 2 3 ] = [ 0 − 2 3 1 3 1 3 ] v_3=x_3-proj_{W_2}x_3=\begin{bmatrix}0\\0\\1\\1\end{bmatrix}-\begin{bmatrix}0\\\frac{2}{3}\\\frac{2}{3}\\\frac{2}{3}\end{bmatrix}=\begin{bmatrix}0\\-\frac{2}{3}\\\frac{1}{3}\\\frac{1}{3}\end{bmatrix} v3=x3projW2x3=00110323232=0323131

所以 { v 1 , v 2 ′ , v 3 } \{v_1,v_2^{'},v_3\} {v1,v2,v3}是W的正交基。

QR分解

定理:如果 m × n m\times n m×n的矩阵 A A A各列线性无关,那么 A A A可以分解为 A = Q R A=QR A=QR,其中 Q Q Q为一个 m × n m\times n m×n的矩阵,其各列形成Col A的一个标准正交基, R R R是一个 n × n n\times n n×n的上三角可逆矩阵,且在对角线上的元素为正数。

例:
求矩阵 A = [ 1 0 0 1 1 0 1 1 1 1 1 1 ] A=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\\1&1&1\end{bmatrix} A=111101110011的一个QR分解。

矩阵 A A A的列向量同上面例2的列向量:
x 1 = [ 1 1 1 1 ] x_1=\begin{bmatrix}1\\1\\1\\1\end{bmatrix} x1=1111 x 2 = [ 0 1 1 1 ] x_2=\begin{bmatrix}0\\1\\1\\1\end{bmatrix} x2=0111 x 3 = [ 0 0 1 1 ] x_3=\begin{bmatrix}0\\0\\1\\1\end{bmatrix} x3=0011

C o l   A = S p a n { x 1 , x 2 , x 3 } Col\space A=Span\{x_1,x_2,x_3\} Col A=Span{x1,x2,x3}的一个正交基在上面例2中求得为:
v 1 = [ 1 1 1 1 ] v_1=\begin{bmatrix}1\\1\\1\\1\end{bmatrix} v1=1111 v 2 ′ = [ − 3 1 1 1 ] v_2^{'}=\begin{bmatrix}-3\\1\\1\\1\end{bmatrix} v2=3111 v 3 = [ 0 − 2 3 1 3 1 3 ] v_3=\begin{bmatrix}0\\-\frac{2}{3}\\\frac{1}{3}\\\frac{1}{3}\end{bmatrix} v3=0323131

重新度量 v 3 v_3 v3,取 v 3 ′ = 3 v 3 = [ 0 − 2 1 1 ] v_3^{'}=3v_3=\begin{bmatrix}0\\-2\\1\\1\end{bmatrix} v3=3v3=0211

v 1 v_1 v1 v 2 ′ v_2^{'} v2 v 3 ′ v_3^{'} v3单位化:
u 1 = v 1 ∣ ∣ v 1 ∣ ∣ = 1 4 [ 1 1 1 1 ] = [ 1 2 1 2 1 2 1 2 ] u_1=\frac{v_1}{||v_1||}=\frac{1}{\sqrt{4}}\begin{bmatrix}1\\1\\1\\1\end{bmatrix}=\begin{bmatrix}\frac{1}{2}\\\frac{1}{2}\\\frac{1}{2}\\\frac{1}{2}\end{bmatrix} u1=v1v1=4 11111=21212121

u 2 = v 2 ′ ∣ ∣ v 2 ′ ∣ ∣ = 1 12 [ − 3 1 1 1 ] = [ − 3 12 1 12 1 12 1 12 ] u_2=\frac{v_2^{'}}{||v_2^{'}||}=\frac{1}{\sqrt{12}}\begin{bmatrix}-3\\1\\1\\1\end{bmatrix}=\begin{bmatrix}-\frac{3}{\sqrt{12}}\\\frac{1}{\sqrt{12}}\\\frac{1}{\sqrt{12}}\\\frac{1}{\sqrt{12}}\end{bmatrix} u2=v2v2=12 13111=12 312 112 112 1

u 3 = v 3 ′ ∣ ∣ v 3 ′ ∣ ∣ = 1 6 [ 0 − 2 1 1 ] = [ 0 − 2 6 1 6 1 6 ] u_3=\frac{v_3^{'}}{||v_3^{'}||}=\frac{1}{\sqrt{6}}\begin{bmatrix}0\\-2\\1\\1\end{bmatrix}=\begin{bmatrix}0\\-\frac{2}{\sqrt{6}}\\\frac{1}{\sqrt{6}}\\\frac{1}{\sqrt{6}}\end{bmatrix} u3=v3v3=6 10211=06 26 16 1

根据QR分解定理: Q Q Q矩阵是待分解矩阵 A A A的列空间的标准正交基,所以:

Q = [ u 1 u 2 u 3 ] = [ 1 2 − 3 12 0 1 2 1 12 − 2 6 1 2 1 12 1 6 1 2 1 12 1 6 ] Q=[u_1\quad u_2\quad u_3]=\begin{bmatrix}\frac{1}{2}&-\frac{3}{\sqrt{12}}&0\\\frac{1}{2}&\frac{1}{\sqrt{12}}&-\frac{2}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\end{bmatrix} Q=[u1u2u3]=2121212112 312 112 112 106 26 16 1

由正交定理2可知,矩阵 Q Q Q的每两列都是正交的且是标准正交的,所以,有 Q T Q = I Q^TQ=I QTQ=I

QR分解是将 A A A可以分解为 A = Q R A=QR A=QR,所以: Q T A = Q T ( Q R ) = I R = R Q^TA=Q^T(QR)=IR=R QTA=QT(QR)=IR=R

这表明,可以根据 R = Q T A R=Q^TA R=QTA来求得 R R R矩阵。

所以,本例中:
R = Q T A = [ 1 2 1 2 1 2 1 2 − 3 12 1 12 1 12 1 12 0 − 2 6 1 6 1 6 ] [ 1 0 0 1 1 0 1 1 1 1 1 1 ] = [ 2 3 2 1 0 3 12 2 12 0 0 2 6 ] R=Q^TA=\begin{bmatrix}\frac{1}{2}&\frac{1}{2}&\frac{1}{2}&\frac{1}{2}\\-\frac{3}{\sqrt{12}}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{12}}\\0&-\frac{2}{\sqrt{6}}&\frac{1}{\sqrt{6}}&\frac{1}{\sqrt{6}}\end{bmatrix}\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\\1&1&1\end{bmatrix}=\begin{bmatrix}2&\frac{3}{2}&1\\0&\frac{3}{\sqrt{12}}&\frac{2}{\sqrt{12}}\\0&0&\frac{2}{\sqrt{6}}\end{bmatrix} R=QTA=2112 302112 16 22112 16 12112 16 1111101110011=2002312 30112 26 2

验算:

Q R = [ 1 2 − 3 12 0 1 2 1 12 − 2 6 1 2 1 12 1 6 1 2 1 12 1 6 ] [ 2 3 2 1 0 3 12 2 12 0 0 2 6 ] = [ 1 0 0 1 1 0 1 1 1 1 1 1 ] = A QR=\begin{bmatrix}\frac{1}{2}&-\frac{3}{\sqrt{12}}&0\\\frac{1}{2}&\frac{1}{\sqrt{12}}&-\frac{2}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\end{bmatrix}\begin{bmatrix}2&\frac{3}{2}&1\\0&\frac{3}{\sqrt{12}}&\frac{2}{\sqrt{12}}\\0&0&\frac{2}{\sqrt{6}}\end{bmatrix}=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\\1&1&1\end{bmatrix}=A QR=2121212112 312 112 112 106 26 16 12002312 30112 26 2=111101110011=A

所以此QR分解正确。

MATLAB中QR分解的方法

  在MATLAB中,可以使用命令[Q R]=qr(A)来对矩阵 A A A进行QR分解。该命令会生成一个标准正交的方针Q和一个上三角矩阵R。
例如,对上述例子,求矩阵 A = [ 1 0 0 1 1 0 1 1 1 1 1 1 ] A=\begin{bmatrix}1&0&0\\1&1&0\\1&1&1\\1&1&1\end{bmatrix} A=111101110011的一个QR分解。

A =
     1     0     0
     1     1     0
     1     1     1
     1     1     1
     
>> [Q R]=qr(A)
Q =
   -0.5000    0.8660         0    0.0000
   -0.5000   -0.2887    0.8165   -0.0000
   -0.5000   -0.2887   -0.4082   -0.7071
   -0.5000   -0.2887   -0.4082    0.7071
R =
   -2.0000   -1.5000   -1.0000
         0   -0.8660   -0.5774
         0         0   -0.8165
         0         0         0

  可见,MATLAB分解出来的 R R R矩阵和计算出来的 R R R矩阵中的每个元素是与原来 R = [ 2 3 2 1 0 3 12 2 12 0 0 2 6 ] R=\begin{bmatrix}2&\frac{3}{2}&1\\0&\frac{3}{\sqrt{12}}&\frac{2}{\sqrt{12}}\\0&0&\frac{2}{\sqrt{6}}\end{bmatrix} R=2002312 30112 26 2每个元素互为相反数的,此外,还在最下面多了一行的0;

且MATLAB分解出来的 Q Q Q矩阵与手算分解出来的 Q = [ 1 2 − 3 12 0 1 2 1 12 − 2 6 1 2 1 12 1 6 1 2 1 12 1 6 ] Q=\begin{bmatrix}\frac{1}{2}&-\frac{3}{\sqrt{12}}&0\\\frac{1}{2}&\frac{1}{\sqrt{12}}&-\frac{2}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\\\frac{1}{2}&\frac{1}{\sqrt{12}}&\frac{1}{\sqrt{6}}\end{bmatrix} Q=2121212112 312 112 112 106 26 16 1是有差别的,除了每个元素互为相反数外,最右边多了一列:

[ 0 − 0 − 0.7071 0.7071 ] \begin{bmatrix}0\\-0\\-0.7071\\0.7071\end{bmatrix} 000.70710.7071;显然,这个分解出来的Q矩阵尽管多了最右边这一列,却也是标准正交的(orthonormal)

  可见,MATLAB分解出来的矩阵,虽然和手算的矩阵有差别,但是显然也是符合 A = Q R A=QR A=QR这个基本要求的,MATLAB分解出来的Q和R矩阵尺寸都是与A相同的。

  由上面的定理2:一个 m × n m\times n m×n的矩阵 U U U具有单位正交列向量的充要条件是 U T U = I U^TU=I UTU=I。(这个矩阵 U U U如果满足此条件,也叫正交矩阵)。以此检验MATLAB分解出来的矩阵 Q Q Q是不是正交矩阵

>> Q
Q =
   -0.5000    0.8660         0    0.0000
   -0.5000   -0.2887    0.8165   -0.0000
   -0.5000   -0.2887   -0.4082   -0.7071
   -0.5000   -0.2887   -0.4082    0.7071
   
>> Q'    //Q的转置
ans =
   -0.5000   -0.5000   -0.5000   -0.5000
    0.8660   -0.2887   -0.2887   -0.2887
         0    0.8165   -0.4082   -0.4082
    0.0000   -0.0000   -0.7071    0.7071

>> Q'*Q
ans =
    1.0000         0         0         0
         0    1.0000         0         0
         0         0    1.0000   -0.0000
         0         0   -0.0000    1.0000

  可见,MATLAB计算出来的矩阵 Q Q Q满足关系 Q T Q = I Q^TQ=I QTQ=I,所以矩阵 Q Q Q是正交矩阵。

  存在差别的原因:手算的QR分解是基于格拉姆-施密特方法的,其计算思路是,先以一个向量为一个基底,然后求与此向量垂直的向量并以之作另一个基底,然后再求与前面这两个相互垂直的基底都垂直的基底,然后再依次求下去,最终得到一组正交基。但是这个方法在计算具有很多列的矩阵的时候,由于浮点计算的误差,得到的正交基中的向量越来越不正交(误差越来越大)。

  所以MATLAB中的QR分解方法是经过优化的数值计算方法,可以处理很大的矩阵。

例:计算矩阵 A = [ 1 2 5 − 1 1 − 4 − 1 4 − 3 1 − 4 7 1 2 1 ] A=\begin{bmatrix}1&2&5\\-1&1&-4\\-1&4&-3\\1&-4&7\\1&2&1\end{bmatrix} A=111112144254371的QR分解(手算加MATLAB)。

解:
列向量分别是:
x 1 = [ 1 − 1 − 1 1 1 ] x_1=\begin{bmatrix}1\\-1\\-1\\1\\1\end{bmatrix} x1=11111 x 2 = [ 2 1 4 − 4 2 ] x_2=\begin{bmatrix}2\\1\\4\\-4\\2\end{bmatrix} x2=21442 x 3 = [ 5 − 4 − 3 7 1 ] x_3=\begin{bmatrix}5\\-4\\-3\\7\\1\end{bmatrix} x3=54371
v 1 = x 1 = [ 1 − 1 − 1 1 1 ] v_1=x_1=\begin{bmatrix}1\\-1\\-1\\1\\1\end{bmatrix} v1=x1=11111

求垂直于 v 1 v_1 v1 v 2 v_2 v2
v 2 = x 2 − x 2 ⋅ v 1 v 1 ⋅ v 1 v 1 = [ 2 1 4 − 4 2 ] − − 5 5 [ 1 − 1 − 1 1 1 ] = [ 3 0 3 − 3 3 ] v_2=x_2-\frac{x_2\cdot v_1}{v_1\cdot v_1}v_1=\begin{bmatrix}2\\1\\4\\-4\\2\end{bmatrix}-\frac{-5}{5}\begin{bmatrix}1\\-1\\-1\\1\\1\end{bmatrix}=\begin{bmatrix}3\\0\\3\\-3\\3\end{bmatrix} v2=x2v1v1x2v1v1=214425511111=30333
重新度量 v 2 ′ = 1 3 v 2 = [ 1 0 1 − 1 1 ] v_2^{'}=\frac{1}{3}v_2=\begin{bmatrix}1\\0\\1\\-1\\1\end{bmatrix} v2=31v2=10111

求垂直于 W 2 = S p a n { v 1 , v 2 ′ } W_2=Span\{v_1,v_2^{'}\} W2=Span{v1,v2} v 3 v_3 v3
p r o j W 2 x 3 = p r o j v 1 x 3 + p r o j v 2 ′ x 3 = x 3 ⋅ v 1 v 1 ⋅ v 1 v 1 + x 3 ⋅ v 2 ′ v 2 ′ ⋅ v 2 ′ v 2 ′ = 20 5 [ 1 − 1 − 1 1 1 ] + − 4 4 [ 1 0 1 − 1 1 ] = [ 3 − 4 − 5 5 3 ] proj_{W_2}x_3=proj_{v_1}x_3+proj_{v_2^{'}}x_3= \frac{x_3\cdot v_1}{v_1\cdot v_1}v_1+\frac{x_3\cdot v_2^{'}}{v_2^{'}\cdot v_2^{'}}v_2^{'}=\frac{20}{5}\begin{bmatrix}1\\-1\\-1\\1\\1\end{bmatrix}+\frac{-4}{4}\begin{bmatrix}1\\0\\1\\-1\\1\end{bmatrix}=\begin{bmatrix}3\\-4\\-5\\5\\3\end{bmatrix} projW2x3=projv1x3+projv2x3=v1v1x3v1v1+v2v2x3v2v2=52011111+4410111=34553
v 3 = x 3 − p r o j W 2 x 3 = [ 5 − 4 − 3 7 1 ] − [ 3 − 4 − 5 5 3 ] = [ 2 0 2 2 − 2 ] v_3=x_3-proj_{W_2}x_3=\begin{bmatrix}5\\-4\\-3\\7\\1\end{bmatrix}-\begin{bmatrix}3\\-4\\-5\\5\\3\end{bmatrix}=\begin{bmatrix}2\\0\\2\\2\\-2\end{bmatrix} v3=x3projW2x3=5437134553=20222
重新度量 v 3 ′ = 1 2 v 3 = [ 1 0 1 1 − 1 ] v_3^{'}=\frac{1}{2}v_3=\begin{bmatrix}1\\0\\1\\1\\-1\end{bmatrix} v3=21v3=10111

所以 { v 1 , v 2 ′ , v 3 ′ } \{v_1,v_2^{'},v_3^{'}\} {v1,v2,v3} R 5 R^5 R5子空间W的一组正交基。
将它们单位化后,可以组成 Q Q Q矩阵:
u 1 = v 1 ∣ ∣ v 1 ∣ ∣ = 1 5 [ 1 − 1 − 1 1 1 ] = [ 1 5 − 1 5 − 1 5 1 5 1 5 ] u_1=\frac{v_1}{||v_1||}=\frac{1}{\sqrt{5}}\begin{bmatrix}1\\-1\\-1\\1\\1\end{bmatrix}=\begin{bmatrix}\frac{1}{\sqrt{5}}\\-\frac{1}{\sqrt{5}}\\-\frac{1}{\sqrt{5}}\\\frac{1}{\sqrt{5}}\\\frac{1}{\sqrt{5}}\end{bmatrix} u1=v1v1=5 111111=5 15 15 15 15 1

u 2 = v 2 ′ ∣ ∣ v 2 ′ ∣ ∣ = 1 4 [ 1 0 1 − 1 1 ] = [ 1 2 0 1 2 − 1 2 1 2 ] u_2=\frac{v_2^{'}}{||v_2^{'}||}=\frac{1}{\sqrt{4}}\begin{bmatrix}1\\0\\1\\-1\\1\end{bmatrix}=\begin{bmatrix}\frac{1}{2}\\0\\\frac{1}{2}\\-\frac{1}{2}\\\frac{1}{2}\end{bmatrix} u2=v2v2=4 110111=210212121

u 3 = v 3 ′ ∣ ∣ v 3 ′ ∣ ∣ = 1 4 [ 1 0 1 1 − 1 ] = [ 1 2 0 1 2 1 2 − 1 2 ] u_3=\frac{v_3^{'}}{||v_3^{'}||}=\frac{1}{\sqrt{4}}\begin{bmatrix}1\\0\\1\\1\\-1\end{bmatrix}=\begin{bmatrix}\frac{1}{2}\\0\\\frac{1}{2}\\\frac{1}{2}\\-\frac{1}{2}\end{bmatrix} u3=v3v3=4 110111=210212121

所以 Q = [ u 1 u 2 u 3 ] = [ 1 5 1 2 1 2 − 1 5 0 0 − 1 5 1 2 1 2 1 5 − 1 2 1 2 1 5 1 2 − 1 2 ] Q=[u_1\quad u_2 \quad u_3]=\begin{bmatrix}\frac{1}{\sqrt{5}}&\frac{1}{2}&\frac{1}{2}\\-\frac{1}{\sqrt{5}}&0&0\\-\frac{1}{\sqrt{5}}&\frac{1}{2}&\frac{1}{2}\\\frac{1}{\sqrt{5}}&-\frac{1}{2}&\frac{1}{2}\\\frac{1}{\sqrt{5}}&\frac{1}{2}&-\frac{1}{2}\end{bmatrix} Q=[u1u2u3]=5 15 15 15 15 1210212121210212121

R R R矩阵:
R = Q T A = [ 1 5 − 1 5 − 1 5 1 5 1 5 1 2 0 1 2 − 1 2 1 2 1 2 0 1 2 1 2 − 1 2 ] [ 1 2 5 − 1 1 − 4 − 1 4 − 3 1 − 4 7 1 2 1 ] = [ 5 − 5 4 5 0 6 − 2 0 0 4 ] R=Q^TA=\begin{bmatrix}\frac{1}{\sqrt{5}}&-\frac{1}{\sqrt{5}}&-\frac{1}{\sqrt{5}}&\frac{1}{\sqrt{5}}&\frac{1}{\sqrt{5}}\\\frac{1}{2}&0&\frac{1}{2}&-\frac{1}{2}&\frac{1}{2}\\\frac{1}{2}&0&\frac{1}{2}&\frac{1}{2}&-\frac{1}{2}\end{bmatrix}\begin{bmatrix}1&2&5\\-1&1&-4\\-1&4&-3\\1&-4&7\\1&2&1\end{bmatrix}=\begin{bmatrix}\sqrt{5}&-\sqrt{5}&4\sqrt{5}\\0&6&-2\\0&0&4\end{bmatrix} R=QTA=5 121215 1005 121215 121215 12121111112144254371=5 005 6045 24

验算:

Q R = [ 1 5 1 2 1 2 − 1 5 0 0 − 1 5 1 2 1 2 1 5 − 1 2 1 2 1 5 1 2 − 1 2 ] [ 5 − 5 4 5 0 6 − 2 0 0 4 ] = [ 1 2 5 − 1 1 − 4 − 1 4 − 3 1 − 4 7 1 2 1 ] = A QR=\begin{bmatrix}\frac{1}{\sqrt{5}}&\frac{1}{2}&\frac{1}{2}\\-\frac{1}{\sqrt{5}}&0&0\\-\frac{1}{\sqrt{5}}&\frac{1}{2}&\frac{1}{2}\\\frac{1}{\sqrt{5}}&-\frac{1}{2}&\frac{1}{2}\\\frac{1}{\sqrt{5}}&\frac{1}{2}&-\frac{1}{2}\end{bmatrix}\begin{bmatrix}\sqrt{5}&-\sqrt{5}&4\sqrt{5}\\0&6&-2\\0&0&4\end{bmatrix}=\begin{bmatrix}1&2&5\\-1&1&-4\\-1&4&-3\\1&-4&7\\1&2&1\end{bmatrix}=A QR=5 15 15 15 15 12102121212102121215 005 6045 24=111112144254371=A

所以此QR分解成立。

在MATLAB中计算QR分解:

A =
     1     2     5
    -1     1    -4
    -1     4    -3
     1    -4     7
     1     2     1
>> [Q R]=qr(A)
Q =
   -0.4472   -0.5000   -0.5000   -0.0236   -0.5472
    0.4472   -0.0000    0.0000    0.8000   -0.4000
    0.4472   -0.5000   -0.5000    0.0236    0.5472
   -0.4472    0.5000   -0.5000    0.4236    0.3472
   -0.4472   -0.5000    0.5000    0.4236    0.3472
R =
   -2.2361    2.2361   -8.9443
         0   -6.0000    2.0000
         0         0   -4.0000
         0         0         0
         0         0         0

  可见,由MATLAB的qr( )函数计算出来的QR分解,对于矩阵 Q Q Q,手算为 5 × 3 5\times 3 5×3矩阵,MATLAB算出来为 5 × 5 5\times 5 5×5矩阵,两者的符号是相反的。两个矩阵 R R R的符号也是相反的,MATLAB的 R R R矩阵下面多了一排0。

  相当于MATLAB是先把手算出来的 Q Q Q矩阵在右边多补两列,并使之成为一个标准正交的方阵 Q 1 Q_1 Q1(这里是5X3变成5X5),然后在 R R R下面增加0的行,使之与 Q 1 Q_1 Q1矩阵能相乘匹配(这里是3X3变成3X5),这样最后乘出来的矩阵尺寸与A相同,并且满足QR分解的约束。

MATLAB中使用格拉姆-施密特方法求标准正交矩阵

  由上面的实验可知,MATLAB中的qr( )函数计算QR分解并非采用格拉姆-施密特方法求解,但是MATLAB中也提供了格拉姆-施密特方法求解正交基的函数,还是上面的矩阵,如下:

A =
     1     2     5
    -1     1    -4
    -1     4    -3
     1    -4     7
     1     2     1
>> G = gs(A)
 Matrix U with orthogonal columns:
U =
     1     3     2
    -1     0     0
    -1     3     2
     1    -3     2
     1     3    -2
rational display:
U =
       1              3              2       
      -1              0              0       
      -1              3              2       
       1             -3              2       
       1              3             -2       
Do you want columns normalized (1/0)? 1
matrix after normalizing columns: 
G =
    0.4472    0.5000    0.5000
   -0.4472         0         0
   -0.4472    0.5000    0.5000
    0.4472   -0.5000    0.5000
    0.4472    0.5000   -0.5000

  可见,使用函数gs( )求出来的正交矩阵,在标准后(运行函数会提示是否标准化,输入1确认)得到标准正交矩阵 G G G,而这个矩阵 G G G和手算出来的 Q Q Q矩阵是一致的。

  • 6
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值