之前介绍的矩阵的三角分解系列介绍了利用矩阵初等变换解决了矩阵三角化问题以及具体的三角分解。但是以初等变换工具的三角分解方法并不能消除病态线性方程组不稳定问题,而且有时候对于可逆矩阵有可能也不存在三角分解。所以后面为了解决这里问题,发展出来了以正交(酉)变换的矩阵的QR(正交三角)分解,矩阵的正交三角分解是一种对任何可逆矩阵均存在理想分解。进行QR分解需要用到施密特(Schmidt)正交规范化,吉文斯(Givens)变换和豪斯霍尔德(Householder)变换等。这里矩阵的QR分解系列教程主要是针对在学习QR分解时候的涉及到的一些细节,包括很多方法的来源和证明等,以及其中用到的一些矩阵操作的基础知识,主要包括:
- [矩阵的QR分解系列一] 施密特(Schmidt)正交规范化
- [矩阵的QR分解系列二] 吉文斯(Givens)变换
- [矩阵的QR分解系列三] 豪斯霍尔德(Householder)变换
- [矩阵的QR分解系列四] QR(正交三角)分解
- [矩阵的QR分解系列五] Eigen中的QR分解
这个系列后面文章会用到前面文章的理论和技术,所以建议按照顺序查看。
简介
镜像变换或者说是豪斯霍尔德(Householder)变换是一种正交变换,经过多次豪斯霍尔德(Householder)变换可以把矩阵转换成上三角形式,是一种常用的 Q R \boldsymbol{Q R} QR分解方式。
镜像变换
反射变换
在平面
R
2
\boldsymbol{R^2}
R2中如果存在变换
f
f
f可以把
α
=
x
e
1
+
y
e
2
\boldsymbol{\alpha}=x\boldsymbol{e_1} + y\boldsymbol{e_2}
α=xe1+ye2转换成
α
′
=
x
e
1
−
y
e
2
\boldsymbol{\alpha}^{\prime}=x\boldsymbol{e_1} - y\boldsymbol{e_2}
α′=xe1−ye2,其中
(
x
,
y
)
(x,y)
(x,y)是在标准正交基
e
1
,
e
2
\boldsymbol{e_1},\boldsymbol{e_2}
e1,e2下的坐标值。这里变换矩阵为
H
=
[
1
0
0
−
1
]
\boldsymbol{H} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right]
H=[100−1]
把
H
\boldsymbol{H}
H称为
R
2
\boldsymbol{R^2}
R2中关于
x
x
x轴的反射阵。那么
R
2
\boldsymbol{R^2}
R2中的向量
ξ
\boldsymbol{\xi}
ξ关于
x
x
x轴反射后变为
η
\boldsymbol{\eta}
η,即
η
=
H
ξ
=
[
1
0
0
−
1
]
ξ
.
\boldsymbol{\eta} = \boldsymbol{H\xi} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right]\boldsymbol{\xi}.
η=Hξ=[100−1]ξ.
同时反射阵
H
\boldsymbol{H}
H可以用与
x
x
x轴正交的单位向量
ω
=
(
0
,
1
)
T
\boldsymbol{\omega}=(0,1)^{\mathrm{T}}
ω=(0,1)T来表示,即
H
=
[
1
0
0
−
1
]
=
[
1
0
0
1
]
−
2
[
0
1
]
(
0
,
1
)
=
I
−
2
ω
ω
T
\boldsymbol{H} = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] = \left[\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}\right] - 2\left[\begin{matrix} 0 \\ 1 \end{matrix}\right](0, 1) = \boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}
H=[100−1]=[1001]−2[01](0,1)=I−2ωωT
镜像变换
前面介绍了平面
R
2
\boldsymbol{R^2}
R2中向量关于
x
x
x轴的反射阵可以用和
x
x
x轴正交的向量
ω
\boldsymbol{\omega}
ω来表示,其实这可以推广到一般的反射变换,在平面平面
R
2
\boldsymbol{R^2}
R2中向量关于
l
l
l轴的反射阵
H
\boldsymbol{H}
H可以用
l
l
l轴正交的向量
ω
\boldsymbol{\omega}
ω来表示。下面就简单推导一下
如上图所示,
ξ
\boldsymbol{\xi}
ξ和
η
\boldsymbol{\eta}
η是平面
R
2
\boldsymbol{R^2}
R2上的同样长度的两个向量,其中
ω
\boldsymbol{\omega}
ω是
ξ
−
η
\boldsymbol{\xi - \eta}
ξ−η同方向(虚线表示的向量)的单位向量,可得
ξ
−
η
=
2
ω
(
ω
T
ξ
)
\boldsymbol{\xi - \eta}=2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)}
ξ−η=2ω(ωTξ)
其中
ω
T
ξ
\boldsymbol{\omega^{\mathrm{T}}\xi}
ωTξ表示向量
ξ
\boldsymbol{\xi}
ξ在
ω
\boldsymbol{\omega}
ω上的投影长度(即内积)。
所以
η
=
ξ
−
2
ω
(
ω
T
ξ
)
=
(
I
−
2
ω
ω
T
)
ξ
.
(1)
\boldsymbol{\eta}=\boldsymbol{\xi} - 2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)} = (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{\xi}. \tag{1}
η=ξ−2ω(ωTξ)=(I−2ωωT)ξ.(1)
又
l
l
l轴(无方向)和向量
ω
\boldsymbol{\omega}
ω正交,其实从几何关系上知道向量
ξ
\boldsymbol{\xi}
ξ和
η
\boldsymbol{\eta}
η关于
l
l
l轴对称,可以简单证明一下:
上图中旋转坐标系,使
ω
\boldsymbol{\omega}
ω和
e
2
=
(
0
,
1
)
T
\boldsymbol{e}_2=(0,1)^{\mathrm{T}}
e2=(0,1)T即
y
y
y轴重合,即
l
l
l轴和
x
x
x轴重合。即
ω
=
[
ω
1
ω
2
]
⇒
[
0
1
]
=
e
2
\boldsymbol{\omega} = \left[\begin{matrix} \omega_1 \\ \omega_2 \end{matrix}\right] \Rightarrow \left[\begin{matrix} 0 \\ 1 \end{matrix}\right] = \boldsymbol{e}_2
ω=[ω1ω2]⇒[01]=e2
令初等旋转矩阵为
Q
=
[
c
o
s
θ
s
i
n
θ
−
s
i
n
θ
c
o
s
θ
]
\boldsymbol{Q} = \left[\begin{matrix} cos \theta & sin \theta \\ -sin \theta & cos \theta \end{matrix}\right]
Q=[cosθ−sinθsinθcosθ]
且
Q
\boldsymbol{Q}
Q是正交矩阵满足
Q
−
1
=
Q
T
\boldsymbol{Q}^{-1} = \boldsymbol{Q}^{\mathrm{T}}
Q−1=QT,令
H
=
I
−
2
ω
ω
T
\boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}
H=I−2ωωT,所以对公式
(
1
)
(1)
(1)转换得
η
=
H
ξ
⇒
Q
η
=
Q
H
Q
−
1
Q
ξ
\boldsymbol{\eta} =\boldsymbol{H\xi} \Rightarrow \boldsymbol{Q\eta} =\boldsymbol{QHQ^{-1}Q\xi}
η=Hξ⇒Qη=QHQ−1Qξ
得
Q
H
Q
−
1
=
Q
(
I
−
2
ω
ω
T
)
Q
T
=
I
−
2
Q
ω
ω
T
Q
T
=
I
−
2
(
Q
ω
)
(
Q
ω
)
T
=
I
−
2
[
0
1
]
(
0
,
1
)
=
[
1
0
0
−
1
]
\begin{aligned} \boldsymbol{QHQ^{-1}} &= \boldsymbol{Q}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2\boldsymbol{Q\omega \omega}^{\mathrm{T}}\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2(\boldsymbol{Q\omega) (Q}\boldsymbol{\omega})^{\mathrm{T}} \\ & = \boldsymbol{I} - 2\left[\begin{matrix} 0 \\ 1 \end{matrix}\right](0, 1) \\ & = \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] \end{aligned}
QHQ−1=Q(I−2ωωT)QT=I−2QωωTQT=I−2(Qω)(Qω)T=I−2[01](0,1)=[100−1]
旋转后的反射阵变成了前面讲解的关于
x
x
x轴的反射阵,所以旋转后的向量
Q
η
\boldsymbol{Q\eta}
Qη和
Q
ξ
\boldsymbol{Q\xi}
Qξ是关于
x
x
x轴对称的。所以原始向量
ξ
\boldsymbol{\xi}
ξ和
η
\boldsymbol{\eta}
η关于与
ω
\boldsymbol{\omega}
ω垂直的
l
l
l轴对称的。因此公式
(
1
)
(1)
(1)确定的变换是关于
l
l
l轴的一种反射变换,反射阵为
H
=
Q
−
1
[
1
0
0
−
1
]
Q
\boldsymbol{H} = \boldsymbol{Q^{-1}} \left[\begin{matrix} 1 & 0 \\ 0 & -1 \end{matrix}\right] \boldsymbol{Q}
H=Q−1[100−1]Q
上面公式右边三个矩阵都是正交矩阵(正交矩阵的逆也是正交矩阵,所以
Q
−
1
\boldsymbol{Q^{-1}}
Q−1也是正交矩阵),所以乘积
H
=
I
−
2
ω
ω
T
\boldsymbol{H}=\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}
H=I−2ωωT也是正交矩阵,同时
d
e
t
H
=
d
e
t
(
I
−
2
ω
ω
T
)
=
−
1
det \boldsymbol{H}= det(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=-1
detH=det(I−2ωωT)=−1
所以最终有
定理1
在欧式空间
R
n
\boldsymbol{R}^n
Rn中,有线性变换将向量
ξ
\boldsymbol{\xi}
ξ映射成与单位向量
ω
\boldsymbol{\omega}
ω正交的
n
−
1
n-1
n−1维子空间对称的向量
η
\boldsymbol{\eta}
η,且有
η
=
(
I
−
2
ω
ω
T
)
ξ
=
H
ξ
\boldsymbol{\eta} = (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{\xi} = \boldsymbol{H\xi}
η=(I−2ωωT)ξ=Hξ
称这种线性变换为镜像变换或豪斯霍尔德(Householder)变换,其中矩阵
H
=
I
−
2
ω
ω
T
.
(2)
\boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}. \tag{2}
H=I−2ωωT.(2)
称为初等反射矩阵或豪斯霍尔德(Householder)矩阵。
性质
基本性质
有 H = I − 2 ω ω T \boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} H=I−2ωωT是欧式空间 R n \boldsymbol{R}^n Rn中的初等反射矩阵,则有该矩阵有以下性质
- H \boldsymbol{H} H是对称的正交矩阵;
- d e t H = d e t ( I − 2 ω ω T ) = − 1 det \boldsymbol{H}= det(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=-1 detH=det(I−2ωωT)=−1.
性质1证明
有
H
=
I
−
2
ω
ω
T
=
I
T
−
(
2
ω
ω
T
)
T
=
(
I
−
2
ω
ω
T
)
T
=
H
T
\boldsymbol{H} = \boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} = \boldsymbol{I}^{\mathrm{T}}-(2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}} =(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}} = \boldsymbol{H}^{\mathrm{T}}
H=I−2ωωT=IT−(2ωωT)T=(I−2ωωT)T=HT,矩阵
H
\boldsymbol{H}
H是对称矩阵。
又有
H
T
H
=
(
I
−
2
ω
ω
T
)
T
(
I
−
2
ω
ω
T
)
=
(
I
−
2
ω
ω
T
)
2
=
I
−
4
ω
ω
T
+
4
ω
(
ω
T
ω
)
ω
T
=
I
−
4
ω
ω
T
+
4
ω
ω
T
=
I
\begin{aligned} \boldsymbol{H}^{\mathrm{T}}\boldsymbol{H} &= (\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^{\mathrm{T}}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})^2 \\ &= \boldsymbol{I}-4\boldsymbol{\omega \omega}^{\mathrm{T}}+4\boldsymbol{\omega (\omega^{\mathrm{T}}\omega)\omega^{\mathrm{T}}} \\ &=\boldsymbol{I}-4\boldsymbol{\omega \omega}^{\mathrm{T}}+4\boldsymbol{\omega \omega}^{\mathrm{T}}=\boldsymbol{I} \end{aligned}
HTH=(I−2ωωT)T(I−2ωωT)=(I−2ωωT)2=I−4ωωT+4ω(ωTω)ωT=I−4ωωT+4ωωT=I
得证。
性质2证明
和上面类似,通过有限次的旋转可使
ω
\boldsymbol{\omega}
ω的第一个分了为正,其余分量全为零,而且
ω
\boldsymbol{\omega}
ω是单位向量,即转换为
e
1
=
(
1
,
0
,
⋯
,
0
)
T
\boldsymbol{e}_1=(1,0,\cdots,0)^{\mathrm{T}}
e1=(1,0,⋯,0)T,具体可参考[矩阵的QR分解系列二] 吉文斯(Givens)变换介绍。这里令这些有限次的旋转为
Q
\boldsymbol{Q}
Q,则
Q
ω
=
e
1
\boldsymbol{Q\omega=e}_1
Qω=e1,同时
Q
\boldsymbol{Q}
Q是正交矩阵。
又
η
=
H
ξ
⇒
Q
η
=
Q
H
Q
−
1
Q
ξ
\boldsymbol{\eta} =\boldsymbol{H\xi} \Rightarrow \boldsymbol{Q\eta} =\boldsymbol{QHQ^{-1}Q\xi}
η=Hξ⇒Qη=QHQ−1Qξ
得
Q
H
Q
−
1
=
Q
(
I
−
2
ω
ω
T
)
Q
T
=
I
−
2
Q
ω
ω
T
Q
T
=
I
−
2
(
Q
ω
)
(
Q
ω
)
T
=
I
−
2
[
1
0
⋮
0
]
(
1
,
0
,
⋯
,
0
)
=
[
−
1
1
⋱
1
]
\begin{aligned} \boldsymbol{QHQ^{-1}} &= \boldsymbol{Q}(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})\boldsymbol{Q}^{\mathrm{T}} \\ & = \boldsymbol{I}-2\boldsymbol{Q\omega \omega}^{\mathrm{T}}\boldsymbol{Q}^{\mathrm{T}} = \boldsymbol{I}-2(\boldsymbol{Q\omega) (Q}\boldsymbol{\omega})^{\mathrm{T}} \\ & = \boldsymbol{I}-2 \left[\begin{matrix} 1 \\ 0 \\ \vdots \\ 0 \end{matrix}\right] (1, 0, \cdots, 0) \\ & = \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \end{aligned}
QHQ−1=Q(I−2ωωT)QT=I−2QωωTQT=I−2(Qω)(Qω)T=I−2⎣⎢⎢⎢⎡10⋮0⎦⎥⎥⎥⎤(1,0,⋯,0)=⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤
所以
Q
η
=
[
−
1
1
⋱
1
]
Q
ξ
\boldsymbol{Q\eta} = \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \boldsymbol{Q\xi}
Qη=⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤Qξ
对于旋转后的向量
Q
η
\boldsymbol{Q\eta}
Qη和
Q
ξ
\boldsymbol{Q\xi}
Qξ而言,仅第一个分量在上面的变换下改变了符号,也就是说
Q
η
\boldsymbol{Q\eta}
Qη可以看作是
Q
ξ
\boldsymbol{Q\xi}
Qξ关于与
e
1
\boldsymbol{e}_1
e1正交的
n
−
1
n-1
n−1维子空间的镜像。
又
H
=
Q
−
1
[
−
1
1
⋱
1
]
Q
\boldsymbol{H} = \boldsymbol{Q^{-1}} \left[\begin{matrix} -1 \\ & 1 \\ & & \ddots \\ & & & 1 \end{matrix}\right] \boldsymbol{Q}
H=Q−1⎣⎢⎢⎡−11⋱1⎦⎥⎥⎤Q
右边每个矩阵都是正交矩阵,所以
H
\boldsymbol{H}
H也是正交矩阵,且
d
e
t
H
=
d
e
t
(
I
−
2
ω
ω
T
)
=
−
1
det \boldsymbol{H}= det(\boldsymbol{I}-2\boldsymbol{\omega \omega}^{\mathrm{T}})=-1
detH=det(I−2ωωT)=−1
得证。
目标方向旋转
定理
镜像变换可以使任何非零向量
ξ
\boldsymbol{\xi}
ξ变成与给定单位向量
ζ
\boldsymbol{\zeta}
ζ同方向的向量
η
\boldsymbol{\eta}
η。
这也是后面为消元做准备,主要目前是怎么利用提供的
ζ
\boldsymbol{\zeta}
ζ求
ω
\boldsymbol{\omega}
ω。
证明
根据之前的图像可知
η
=
∣
ξ
∣
ζ
,
a
n
d
ω
T
ξ
=
(
ω
,
ξ
)
=
ω
⋅
ξ
=
∣
ω
∣
∣
ξ
∣
c
o
s
(
ω
,
ξ
)
=
1
2
∣
ξ
−
η
∣
\begin{aligned} \boldsymbol{\eta} &= |\boldsymbol{\xi}|\boldsymbol{\zeta}, and \\ \boldsymbol{\omega^{\mathrm{T}}\xi} &= (\boldsymbol{\omega},\boldsymbol{\xi}) = \boldsymbol{\omega} \cdot \boldsymbol{\xi} \\ & = |\boldsymbol{\omega}| |\boldsymbol{\xi}|cos(\boldsymbol{\omega}, \boldsymbol{\xi}) \\ &= \frac{1}{2}|\boldsymbol{\xi}-\boldsymbol{\eta}| \end{aligned}
ηωTξ=∣ξ∣ζ,and=(ω,ξ)=ω⋅ξ=∣ω∣∣ξ∣cos(ω,ξ)=21∣ξ−η∣
又由
ξ
−
η
=
2
ω
(
ω
T
ξ
)
\boldsymbol{\xi - \eta}=2\boldsymbol{\omega(\omega^{\mathrm{T}}\xi)}
ξ−η=2ω(ωTξ),从而得
ω
=
ξ
−
η
2
(
ω
T
ξ
)
=
ξ
−
η
∣
ξ
−
η
∣
=
ξ
−
∣
ξ
∣
ζ
∣
ξ
−
∣
ξ
∣
ζ
∣
.
(3)
\boldsymbol{\omega} = \frac{\boldsymbol{\xi - \eta}}{2\boldsymbol{(\omega^{\mathrm{T}}\xi)}} = \frac{\boldsymbol{\xi - \eta}}{|\boldsymbol{\xi}-\boldsymbol{\eta}|} = \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|}. \tag{3}
ω=2(ωTξ)ξ−η=∣ξ−η∣ξ−η=∣ξ−∣ξ∣ζ∣ξ−∣ξ∣ζ.(3)
记住这个公式,后面求
Q
R
\boldsymbol{QR}
QR分解会用到。
然后又有
H
=
I
−
2
ω
ω
T
\boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}}
H=I−2ωωT得
η
=
H
ξ
=
(
I
−
2
(
ξ
−
∣
ξ
∣
ζ
)
(
ξ
−
∣
ξ
∣
ζ
)
T
∣
ξ
−
∣
ξ
∣
ζ
∣
2
)
ξ
=
ξ
−
2
(
ξ
−
∣
ξ
∣
ζ
,
ξ
)
ξ
−
∣
ξ
∣
ζ
∣
ξ
−
∣
ξ
∣
ζ
∣
2
=
ξ
−
(
ξ
−
∣
ξ
∣
ζ
)
=
∣
ξ
∣
ζ
\begin{aligned} \boldsymbol{\eta} &= \boldsymbol{H\xi} \\ &=(\boldsymbol{I} - 2\frac{(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}})(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}})^{\mathrm{T}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2}) \boldsymbol{\xi} \\ &= \boldsymbol{\xi} - 2(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}},\boldsymbol{\xi})\frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2} \\ &= \boldsymbol{\xi} - (\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}) = |\boldsymbol{\xi}|\boldsymbol{\zeta} \end{aligned}
η=Hξ=(I−2∣ξ−∣ξ∣ζ∣2(ξ−∣ξ∣ζ)(ξ−∣ξ∣ζ)T)ξ=ξ−2(ξ−∣ξ∣ζ,ξ)∣ξ−∣ξ∣ζ∣2ξ−∣ξ∣ζ=ξ−(ξ−∣ξ∣ζ)=∣ξ∣ζ
其中利用下面的等式
2
(
ξ
−
∣
ξ
∣
ζ
,
ξ
)
=
2
(
ξ
−
η
,
ξ
)
=
2
∣
ξ
∣
c
o
s
(
ξ
−
η
,
ξ
)
∣
ξ
−
η
∣
=
2
∣
ξ
∣
c
o
s
(
ω
,
ξ
)
∣
ξ
−
η
∣
=
∣
ξ
−
η
∣
2
=
∣
ξ
−
∣
ξ
∣
ζ
∣
2
\begin{aligned} 2(\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}},\boldsymbol{\xi}) &= 2(\boldsymbol{\xi - \eta},\boldsymbol{\xi}) \\ &= 2|\boldsymbol{\xi}|cos(\boldsymbol{\xi - \eta}, \boldsymbol{\xi})|\boldsymbol{\xi - \eta}| = 2|\boldsymbol{\xi}|cos(\boldsymbol{\omega}, \boldsymbol{\xi})|\boldsymbol{\xi - \eta}| \\ &= |\boldsymbol{\xi - \eta}|^2 = |\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|^2 \end{aligned}
2(ξ−∣ξ∣ζ,ξ)=2(ξ−η,ξ)=2∣ξ∣cos(ξ−η,ξ)∣ξ−η∣=2∣ξ∣cos(ω,ξ)∣ξ−η∣=∣ξ−η∣2=∣ξ−∣ξ∣ζ∣2
得证。
初等反射矩阵 转 初等旋转矩阵
定理
初等旋转矩阵(变换)是两个初等反射矩阵(变换)的乘积。
证明
对于初等旋转矩阵
R
i
j
=
[
1
⋱
1
c
0
⋯
0
s
0
1
⋯
0
0
⋮
⋮
⋮
⋮
0
0
⋯
1
0
−
s
0
⋯
0
c
1
⋱
1
]
\boldsymbol{R}_{i j} = \left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & c & 0 & \cdots & 0 & s \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -s & 0 & \cdots & 0 & c \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right]
Rij=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1c0⋮0−s01⋮00⋯⋯⋯⋯00⋮10s0⋮0c1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
(1) 取单位向量
ω
=
(
0
,
⋯
,
0
,
s
i
n
θ
4
,
0
,
⋯
,
0
,
c
o
s
θ
4
,
0
,
⋯
,
0
)
T
\boldsymbol{\omega} = (0,\cdots,0,sin \frac{\theta}{4},0,\cdots,0,cos \frac{\theta}{4},0,\cdots,0)^{\mathrm{T}}
ω=(0,⋯,0,sin4θ,0,⋯,0,cos4θ,0,⋯,0)T
其中
ω
i
=
s
i
n
θ
4
,
ω
j
=
c
o
s
θ
4
\boldsymbol{\omega}_i = sin \frac{\theta}{4},\boldsymbol{\omega}_j = cos \frac{\theta}{4}
ωi=sin4θ,ωj=cos4θ。
根据公式
(
2
)
(2)
(2)构造初等反射阵
H
1
=
I
−
2
ω
ω
T
=
[
1
⋱
1
c
o
s
θ
2
0
⋯
0
−
s
i
n
θ
2
0
1
⋯
0
0
⋮
⋮
⋮
⋮
0
0
⋯
1
0
−
s
i
n
θ
2
0
⋯
0
−
c
o
s
θ
2
1
⋱
1
]
\begin{aligned} \boldsymbol{H}_1& = \boldsymbol{I} - 2\boldsymbol{\omega \omega}^{\mathrm{T}} \\ &=\left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & cos \frac{\theta}{2} & 0 & \cdots & 0 & -sin \frac{\theta}{2} \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -sin \frac{\theta}{2} & 0 & \cdots & 0 & -cos \frac{\theta}{2} \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right] \end{aligned}
H1=I−2ωωT=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1cos2θ0⋮0−sin2θ01⋮00⋯⋯⋯⋯00⋮10−sin2θ0⋮0−cos2θ1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
(2) 再取单位向量
ω
′
=
(
0
,
⋯
,
0
,
s
i
n
3
θ
4
,
0
,
⋯
,
0
,
c
o
s
3
θ
4
,
0
,
⋯
,
0
)
T
\boldsymbol{\omega}^{\prime} = (0,\cdots,0,sin \frac{3\theta}{4},0,\cdots,0,cos \frac{3\theta}{4},0,\cdots,0)^{\mathrm{T}}
ω′=(0,⋯,0,sin43θ,0,⋯,0,cos43θ,0,⋯,0)T
其中
ω
i
′
=
s
i
n
θ
4
,
ω
j
′
=
c
o
s
θ
4
\boldsymbol{\omega}_i^{\prime} = sin \frac{\theta}{4},\boldsymbol{\omega}_j^{\prime} = cos \frac{\theta}{4}
ωi′=sin4θ,ωj′=cos4θ。
根据公式
(
2
)
(2)
(2)构造初等反射阵
H
2
=
I
−
2
ω
′
ω
′
T
=
[
1
⋱
1
c
o
s
3
θ
2
0
⋯
0
−
s
i
n
3
θ
2
0
1
⋯
0
0
⋮
⋮
⋮
⋮
0
0
⋯
1
0
−
s
i
n
3
θ
2
0
⋯
0
−
c
o
s
3
θ
2
1
⋱
1
]
\begin{aligned} \boldsymbol{H}_2& = \boldsymbol{I} - 2\boldsymbol{\omega^{\prime} \omega^{\prime}}^{\mathrm{T}} \\ &=\left[\begin{matrix} 1 \\ & \ddots \\ & & 1 \\ & & & cos \frac{3\theta}{2} & 0 & \cdots & 0 & -sin \frac{3\theta}{2} \\ & & & 0 & 1 & \cdots & 0 & 0 \\ & & & \vdots & \vdots & & \vdots & \vdots \\ & & & 0 & 0 & \cdots & 1 & 0 \\ & & & -sin \frac{3\theta}{2} & 0 & \cdots & 0 & -cos \frac{3\theta}{2} \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{matrix}\right] \end{aligned}
H2=I−2ω′ω′T=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡1⋱1cos23θ0⋮0−sin23θ01⋮00⋯⋯⋯⋯00⋮10−sin23θ0⋮0−cos23θ1⋱1⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
可以验证有
R
i
j
=
H
2
H
1
\boldsymbol{R}_{i j}=\boldsymbol{H}_2\boldsymbol{H}_1
Rij=H2H1。
所以说初等反射矩阵比初等旋转矩阵更加基本。
例子
用镜像变化把向量
ξ
=
(
0
,
3
,
0
,
4
)
T
\boldsymbol{\xi}=(0,3,0,4)^{\mathrm{T}}
ξ=(0,3,0,4)T变为与向量
e
1
=
(
1
,
0
,
0
,
0
)
T
\boldsymbol{e}_1=(1,0,0,0)^{\mathrm{T}}
e1=(1,0,0,0)T同方向的向量。
解:
用上面的公式
(
3
)
(3)
(3)可得
ω
=
ξ
−
∣
ξ
∣
ζ
∣
ξ
−
∣
ξ
∣
ζ
∣
=
ξ
−
∣
ξ
∣
e
1
∣
ξ
−
∣
ξ
∣
e
1
∣
=
(
−
5
,
3
,
0
,
4
)
T
∣
(
−
5
,
3
,
0
,
4
)
T
∣
=
(
−
1
2
,
3
5
2
,
0
,
4
5
2
)
T
\begin{aligned} \boldsymbol{\omega} &= \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{\zeta}}|} = \frac{\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{e}_1}}{|\boldsymbol{\xi - |\boldsymbol{\xi}|\boldsymbol{e}_1}|} \\ &=\frac{(-5,3,0,4)^{\mathrm{T}}}{|(-5,3,0,4)^{\mathrm{T}}|} \\ &=(-\frac{1}{\sqrt{2}},\frac{3}{5\sqrt{2}},0,\frac{4}{5\sqrt{2}})^{\mathrm{T}} \end{aligned}
ω=∣ξ−∣ξ∣ζ∣ξ−∣ξ∣ζ=∣ξ−∣ξ∣e1∣ξ−∣ξ∣e1=∣(−5,3,0,4)T∣(−5,3,0,4)T=(−21,523,0,524)T
则镜像变换的豪斯霍尔德(Householder)矩阵为
H
=
I
−
2
ω
ω
T
=
[
0
3
5
0
4
5
3
5
16
25
0
−
12
25
0
0
1
0
4
5
−
12
25
0
9
25
]
\boldsymbol{H=I}-2\boldsymbol{\omega \omega}^{\mathrm{T}} = \left[\begin{matrix} 0 & \frac{3}{5} & 0 & \frac{4}{5} \\ \frac{3}{5} & \frac{16}{25} & 0 & -\frac{12}{25} \\ 0 & 0 & 1 & 0 \\ \frac{4}{5} & -\frac{12}{25} & 0 & \frac{9}{25} \end{matrix}\right]
H=I−2ωωT=⎣⎢⎢⎡0530545325160−2512001054−25120259⎦⎥⎥⎤
所以
η
=
H
ξ
=
(
5
,
0
,
0
,
0
)
T
=
5
e
1
.
\boldsymbol{\eta} = \boldsymbol{H\xi} = (5,0,0,0)^{\mathrm{T}} = 5\boldsymbol{e}_1.
η=Hξ=(5,0,0,0)T=5e1.
引用
【1】 矩阵论(第二版)