关于矩阵的特征值之和等于矩阵的迹解析(1、2点是行列式计算基础,已懂行列式计算直接看第3、4点解释)
一. 排列
定义1:作为定义n 级行列式的准备,我们先来了解一下排列的性质。
由1,2,⋯, n 组成的一个有序数组称为一个n 级排列。
定义2:在一个排列中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就称为一个逆序,一个排列中逆序的总数就称为这个排列的逆序数。
例如:2431 中,21,43,41,31 是逆序,2431 的逆序数就是4。而45321 的逆序数是9。排列
j
1
j
2
⋯
j
n
j_1 j_2 ⋯ j_n
j1j2⋯jn的逆序数记为
τ
(
j
1
j
2
⋯
j
n
)
τ( j_1 j _2 ⋯ j_n )
τ(j1j2⋯jn)
定义3:逆序数为偶数的排列称为偶排列;逆序数为奇数的排列称为奇排列。
把一个排列中某两个数的位置互换,而其余的数不动,就得到另一个排列.这样一个变换称为一个对换。例如,经过1,2 对换,排列2431 就变成了1432,排列2134 就变成了1234。显然,如果连续施行两次相同的对换,那么排列就还原了。由此得知,一个对换把全部n 级排列两两配对,使每两个配成对的n 级排列在这个对换下互变。
定理1:对换改变排列的奇偶性。这就是说,经过一次对换,奇排列变成偶排列,偶排列变成奇排列。
二.行列式计算
在理解了上面的排列之后就可以明白行列式计算的定义了。
行列式计算定义:
n 级行列式等于所有取自不同行不同列的n 个元素的乘积
a
1
j
1
a
2
j
2
⋯
a
n
j
n
(1)
a_{1j_1}a_{2 j2}⋯ a_{njn} \tag {1}
a1j1a2j2⋯anjn(1)
的代数和,这里
j
1
j
2
⋯
j
n
j_1 j_2 ⋯ j_n
j1j2⋯jn 是1,2,⋯, n 的一个排列,每一项(1)都按下列规则带有符号:当
j
1
j
2
⋯
j
n
j_1 j_2 ⋯ j_n
j1j2⋯jn 是偶排列时, (1)带有正号,当
j
1
j
2
⋯
j
n
j_1 j_2 ⋯ j_n
j1j2⋯jn是奇排列时,(1)带有负号。这一定义可写成:
这里
Σ
j
1
j
2
⋯
j
n
Σ _{j1j2⋯ jn}
Σj1j2⋯jn表示对所有n 级排列求和。
三.矩阵的特征值之和等于矩阵的迹
首先,求矩阵特征值相信大家都知道,就是通过下面这个公式等于0求出特征值的:
根据上面学到的排列和行列式计算,我们知道如果第一行没有选择
λ
−
a
11
\lambda-a_{11}
λ−a11这个元素,得到的
a
1
j
1
a
2
j
2
⋯
a
n
j
n
a_{1j_1}a_{2 j2}⋯ a_{njn}
a1j1a2j2⋯anjn中
λ
\lambda
λ的幂最多只能为
λ
n
−
2
\lambda^{n-2}
λn−2,得不到
λ
n
−
1
\lambda^{n-1}
λn−1,所以只有选择对角线元素相乘才能得到
λ
n
−
1
\lambda^{n-1}
λn−1和
λ
n
\lambda^{n}
λn 。即:
(
λ
−
a
11
)
(
λ
−
a
22
)
(
λ
−
a
33
)
.
.
.
.
.
.
(
λ
−
a
n
n
)
(\lambda-a_{11})(\lambda-a_{22})(\lambda-a_{33})......(\lambda-a_{nn})
(λ−a11)(λ−a22)(λ−a33)......(λ−ann)
λ
n
−
1
\lambda^{n-1}
λn−1的系数为:
−
1
(
a
11
+
a
22
+
a
33
+
.
.
.
.
.
.
+
a
n
n
)
-1(a_{11}+a_{22}+a_{33}+......+a_{nn})
−1(a11+a22+a33+......+ann)
因为代数基本定理,
d
e
t
(
λ
I
−
A
)
det(\lambda I-A)
det(λI−A) 有n个根,它们就是n个特征值,也就是说:
d
e
t
(
λ
I
−
A
)
=
(
λ
−
λ
1
)
(
λ
−
λ
2
)
(
λ
−
λ
3
)
.
.
.
.
.
.
(
λ
−
λ
n
)
det(\lambda I-A)=(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)......(\lambda-\lambda_n)
det(λI−A)=(λ−λ1)(λ−λ2)(λ−λ3)......(λ−λn)
λ
n
−
1
\lambda^{n-1}
λn−1 这一项的系数恰好是
−
(
λ
1
+
λ
2
+
.
.
.
.
.
.
λ
n
)
-(\lambda_1+\lambda_2+......\lambda_n)
−(λ1+λ2+......λn)
所以,矩阵的特征值之和等于矩阵的迹。
四. 矩阵特征值的积=行列式的值
其实:
d
e
t
(
λ
I
−
A
)
=
λ
n
−
(
a
11
+
a
22
+
⋯
+
a
n
n
)
λ
n
−
1
+
⋯
+
(
−
1
)
n
∣
A
∣
det(\lambda I-A)=\lambda^{n}-\left(a_{11}+a_{22}+\cdots+a_{n n}\right) \lambda^{n-1}+\cdots+(-1)^{n}|A|
det(λI−A)=λn−(a11+a22+⋯+ann)λn−1+⋯+(−1)n∣A∣
为什么最后一项常数项是这样呢?因为:
d
e
t
(
λ
I
−
A
)
det(\lambda I-A)
det(λI−A) 中另
λ
=
0
\lambda=0
λ=0得常数项
∣
−
A
∣
=
(
−
1
)
n
∣
A
∣
|-A|=(-1)^{n}|A|
∣−A∣=(−1)n∣A∣
对比:
d
e
t
(
λ
I
−
A
)
=
(
λ
−
λ
1
)
(
λ
−
λ
2
)
(
λ
−
λ
3
)
.
.
.
.
.
.
(
λ
−
λ
n
)
det(\lambda I-A)=(\lambda-\lambda_1)(\lambda-\lambda_2)(\lambda-\lambda_3)......(\lambda-\lambda_n)
det(λI−A)=(λ−λ1)(λ−λ2)(λ−λ3)......(λ−λn)
可得:
矩阵特征值的积=行列式的值
五、不同特征值对应的特征向量线性无关
六、实对称矩阵不同特征值对应特征向量正交
七、矩阵相似及对角化
矩阵相似定义:设A、B都是n阶矩阵,若存在可逆矩阵P,使得:
P
−
1
A
P
=
B
P^{-1} A P=B
P−1AP=B
则称A、B相似。
可对角化充要条件:矩阵A有n个线性无关的特征向量(其实就是上面的P矩阵里面是B的特征向量,A是由B的特征值组成的对角阵,P要可逆肯需要特征向量线性无关呀)。(证明待补充)
推论: 如果矩阵A有n各不同的特征值,则A可对角化(由五可知:不同特征值对应的特征向量线性无关)。
参考链接
参考书籍:高等代数北大版