在进行实对称矩阵性质的数学证明之前,先证明一些会用到的有用理论。首先先引入复数的共轭概念:
- 假设z是复数(complex number),z = a + bi,则z的共轭(conjugate of z)则写作
z⎯⎯=a −bi
z
¯
=
a
−
b
i
,利用复数的运算法则一下5条性质不难证明:
z+w⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯=z⎯⎯+w⎯⎯⎯⎯zw⎯⎯⎯⎯⎯⎯=z⎯⎯∗w⎯⎯⎯⎯zz⎯⎯=a2+b2λx⎯⎯⎯⎯⎯⎯=λ⎯⎯⎯∗x⎯⎯⎯AB⎯⎯⎯⎯⎯⎯⎯=A⎯⎯⎯⎯∗B⎯⎯⎯⎯,A∈Cm∗n,B∈Cn∗k z + w ¯ = z ¯ + w ¯ z w ¯ = z ¯ ∗ w ¯ z z ¯ = a 2 + b 2 λ x ¯ = λ ¯ ∗ x ¯ A B ¯ = A ¯ ∗ B ¯ , A ∈ C m ∗ n , B ∈ C n ∗ k
其中最后一条性质用矩阵的乘法规则即可证明
AB⎯⎯⎯⎯⎯⎯⎯=A{b1, b2, ..., bk}⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯={Ab1⎯⎯⎯⎯⎯⎯⎯⎯⎯, Ab2⎯⎯⎯⎯⎯⎯⎯⎯⎯, ..., Abk⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯}Ab1⎯⎯⎯⎯⎯⎯⎯⎯⎯=⎛⎝⎜⎜⎜⎜⎜a1b1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯a2b1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯...amb1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎞⎠⎟⎟⎟⎟⎟∵a1b1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯ = a1⎯⎯⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯∴Ab1⎯⎯⎯⎯⎯⎯⎯⎯⎯=⎛⎝⎜⎜⎜⎜⎜a1b1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯a2b1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯...amb1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎞⎠⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜a1⎯⎯⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯a2⎯⎯⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯...am⎯⎯⎯⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯⎞⎠⎟⎟⎟⎟⎟=A⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯∴AB⎯⎯⎯⎯⎯⎯⎯=A{b1, b2, ..., bk}⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯={Ab1⎯⎯⎯⎯⎯⎯⎯⎯⎯, Ab2⎯⎯⎯⎯⎯⎯⎯⎯⎯, ..., Abk⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯}={A⎯⎯⎯⎯∗b1⎯⎯⎯⎯⎯⎯, A⎯⎯⎯⎯∗b2⎯⎯⎯⎯⎯⎯, ...,A⎯⎯⎯⎯∗bk⎯⎯⎯⎯⎯⎯}=A⎯⎯⎯⎯∗B⎯⎯⎯⎯ A B ¯ = A { b 1 , b 2 , . . . , b k } ¯ = { A b 1 ¯ , A b 2 ¯ , . . . , A b k ¯ } A b 1 ¯ = ( a 1 b 1 ¯ a 2 b 1 ¯ . . . a m b 1 ¯ ) ∵ a 1 b 1 ¯ = a 1 ¯ ∗ b 1 ¯ ∴ A b 1 ¯ = ( a 1 b 1 ¯ a 2 b 1 ¯ . . . a m b 1 ¯ ) = ( a 1 ¯ ∗ b 1 ¯ a 2 ¯ ∗ b 1 ¯ . . . a m ¯ ∗ b 1 ¯ ) = A ¯ ∗ b 1 ¯ ∴ A B ¯ = A { b 1 , b 2 , . . . , b k } ¯ = { A b 1 ¯ , A b 2 ¯ , . . . , A b k ¯ } = { A ¯ ∗ b 1 ¯ , A ¯ ∗ b 2 ¯ , . . . , A ¯ ∗ b k ¯ } = A ¯ ∗ B ¯ 定理一:
A是n*n实矩阵且 λ λ 和 x x 是它的特征值和对应的特征向量,则 λ⎯⎯⎯ λ ¯ 和 x⎯⎯⎯ x ¯ 也是A的特征值和对应的特征向量。证明:
∵A是实矩阵∴A=A⎯⎯⎯⎯且知Ax=λxAx⎯⎯⎯ =A⎯⎯⎯⎯∗x⎯⎯⎯=Ax⎯⎯⎯⎯⎯⎯⎯=λx⎯⎯⎯⎯⎯⎯=λ⎯⎯⎯∗x⎯⎯⎯得证 ∵ A 是 实 矩 阵 ∴ A = A ¯ 且 知 A x = λ x A x ¯ = A ¯ ∗ x ¯ = A x ¯ = λ x ¯ = λ ¯ ∗ x ¯ 得 证定理二
如果A是n*n的实对称矩阵,则A的所有特征值都为实数。证明:
- 不妨设
Ax=λx
A
x
=
λ
x
且
x
x
不为0向量, 则由定理一可知
x⎯⎯⎯
x
¯
也是A的特征向量,且有
Ax⎯⎯⎯ =λ⎯⎯⎯∗x⎯⎯⎯
A
x
¯
=
λ
¯
∗
x
¯
。我们有如下变换:
x⎯⎯⎯TAx=x⎯⎯⎯Tλx=λx⎯⎯⎯Tx(1) (1) x ¯ T A x = x ¯ T λ x = λ x ¯ T x又因为 Ax A x 是向量,所以 x⎯⎯⎯TAx = (Ax)Tx⎯⎯⎯ x ¯ T A x = ( A x ) T x ¯ ,所以从式(1)可得λx⎯⎯⎯Tx=x⎯⎯⎯TAx = (Ax)Tx⎯⎯⎯=xTATx⎯⎯⎯=xTAx⎯⎯⎯=λ⎯⎯⎯xTx⎯⎯⎯ λ x ¯ T x = x ¯ T A x = ( A x ) T x ¯ = x T A T x ¯ = x T A x ¯ = λ ¯ x T x ¯,因为 xTx⎯⎯⎯=x⎯⎯⎯Tx⩾0 x T x ¯ = x ¯ T x ⩾ 0 ,所以 λ=λ⎯⎯⎯ λ = λ ¯ ,所以所有特征值都为实数。
- 不妨设
Ax=λx
A
x
=
λ
x
且
x
x
不为0向量, 则由定理一可知
x⎯⎯⎯
x
¯
也是A的特征向量,且有
Ax⎯⎯⎯ =λ⎯⎯⎯∗x⎯⎯⎯
A
x
¯
=
λ
¯
∗
x
¯
。我们有如下变换:
加一点自己的思考,如果一个矩阵A所有的特征值都为实数,则所有的特征向量也都是实向量,因为通过计算特征向量方式(求解 (A−λI)x=0 ( A − λ I ) x = 0 )可以知道,不可能解出复数。
相似矩阵
如果说n*n阶的矩阵A和矩阵B是相似的(similar),那么存在一个n*n阶的非奇异矩阵(nonsingular)S是的 B=S−1AS B = S − 1 A S 。
相似矩阵具有相同的特征多项式(characteristic polynomial),所以他们具有相同的特征值。
det(S−1AS−λI)=det(S−1AS−λS−1S)=det(S−1(A−λI)S)=det(S−1)det(A−λI)det(S)=det(A−λI) d e t ( S − 1 A S − λ I ) = d e t ( S − 1 A S − λ S − 1 S ) = d e t ( S − 1 ( A − λ I ) S ) = d e t ( S − 1 ) d e t ( A − λ I ) d e t ( S ) = d e t ( A − λ I )定理三
A是一个n*n的矩阵且它所有的特征值都是实数,则必定存在一个正交矩阵(orthogonal matrix)Q使得如下等式成立:QTAQ=T Q T A Q = T其中T是一个n*n的上三角矩阵。
证明:
用数学归纳法来证明这个定理:当A是2*2矩阵的时候,不妨设 Au=λu A u = λ u ,使用格莱姆-施密特正交化方法(Gram-Schmit Orthogonalization)可以构建出这样一个正交矩阵 Q={u,v} Q = { u , v } ,则:
QTAQ=(uTvT)A(uv)=(uTvT)(AuAv)=(uTAuvTAuuTAvvTAv)=(λ0uTAvvTAv) Q T A Q = ( u T v T ) A ( u v ) = ( u T v T ) ( A u A v ) = ( u T A u u T A v v T A u v T A v ) = ( λ u T A v 0 v T A v )
则对2*2矩阵定理三成立当A是3*3矩阵的时候,做相同假设,则存在一个正交矩阵 Q={u,v,w} Q = { u , v , w } , 则:
B=QTAQ=⎛⎝⎜⎜⎜uTvTwT⎞⎠⎟⎟⎟A(uvw)=⎛⎝⎜⎜⎜uTvTwT⎞⎠⎟⎟⎟(AuAvAw)=⎛⎝⎜⎜⎜uTAuvTAuwTAuuTAvvTAvwTAvuTAwvTAwwTAw⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜λ00uTAvvTAvwTAvuTAwvTAwwTAw⎞⎠⎟⎟⎟=(λ0∗A1),其中A1=(vTAvwTAvvTAwwTAw) B = Q T A Q = ( u T v T w T ) A ( u v w ) = ( u T v T w T ) ( A u A v A w ) = ( u T A u u T A v u T A w v T A u v T A v v T A w w T A u w T A v w T A w ) = ( λ u T A v u T A w 0 v T A v v T A w 0 w T A v w T A w ) = ( λ ∗ 0 A 1 ) , 其 中 A 1 = ( v T A v v T A w w T A v w T A w )
又因为det(QTAQ−βI)=(λ−β0∗A1−βI)=(λ−β)∗det(A1−βI) d e t ( Q T A Q − β I ) = ( λ − β ∗ 0 A 1 − β I ) = ( λ − β ) ∗ d e t ( A 1 − β I )
可以看出 A1 A 1 的每一个特征值都是 B B 的特征值, 又因为B和A是相似矩阵,所以B与A具有相同的特征值,且A的特征值全是实数,所以的特征值也全是实数。既然 A1 A 1 的特征值全是实数且A是2*2矩阵,运用第一步证明则存在一个正交矩阵S,使得 STAS=T S T A S = T ,构建如下矩阵R:
R=(100S) R = ( 1 0 0 S )
则存在下列性质:
RTR=(100ST)(100S)=(100STS)=I R T R = ( 1 0 0 S T ) ( 1 0 0 S ) = ( 1 0 0 S T S ) = I
则矩阵QR是正交矩阵,因为 (QR)TQR=RTQTQR=RTR=I ( Q R ) T Q R = R T Q T Q R = R T R = I ,进一步计算:
(QR)TA(QR)=RTQTAQR=(100ST)(λ0∗A1)(100S)=(10∗STA1S)=(10∗T) ( Q R ) T A ( Q R ) = R T Q T A Q R = ( 1 0 0 S T ) ( λ ∗ 0 A 1 ) ( 1 0 0 S ) = ( 1 ∗ 0 S T A 1 S ) = ( 1 ∗ 0 T )
则对3*3矩阵定理三得证。现在假设定理三对(n-1)*(n-1)阶矩阵成立。
A是n*n的矩阵,且所有的特征值为实数,不妨设 Au=λu A u = λ u ,则利用格莱姆-施密特正交化方法,可以找到这样一组标准正交基,构成矩阵 Q={u,v,w,...} Q = { u , v , w , . . . } ,然后有
QTAQ=(λ0∗A1) Q T A Q = ( λ ∗ 0 A 1 )
利用之前所提到的特征多项式方法可以证明(n-1)*(n-1)阶的 A1 A 1 的特征值全是实数,所以它满足此定理,所以有 STA1S=T S T A 1 S = T 。存在矩阵P:P=(100S) P = ( 1 0 0 S )
则QP是正交矩阵,继而又有:(QP)TA(QP)=PTQTAQP=(100ST)(λ0∗A1)(100S)=(10∗STA1S)=(10∗T) ( Q P ) T A ( Q P ) = P T Q T A Q P = ( 1 0 0 S T ) ( λ ∗ 0 A 1 ) ( 1 0 0 S ) = ( 1 ∗ 0 S T A 1 S ) = ( 1 ∗ 0 T )
所以定理三对n*n矩阵有效。
上述定理中对矩阵的分解其实是舒尔分解(Schur Decomposition)中的一个特例(仅针对特征向量全是实数的矩阵)。对实对称矩阵的一个重要定理我们要用到它。
- 定理四
如果矩阵A是实对称矩阵,则必定存在一个正交矩阵Q,使得 QTAQ=D Q T A Q = D ,其中D是对角矩阵。
证明:
由定理二可知,A特征值全是实数。由定理三可知 QTAQ=T Q T A Q = T ,所以:
TT=(QTAQ)T=QTATQ=QTAQ=T T T = ( Q T A Q ) T = Q T A T Q = Q T A Q = T,所以T是对角矩阵。
把上述定理做个变形可得 A=QDQT A = Q D Q T ,也就解释了为什么实对称矩阵在做特征分解的时候可以分解为一个正交矩阵乘以对角矩阵再乘以正交矩阵的转置,正交矩阵的每一列是一个特征向量,对应对角矩阵中的特征向量。