一、特征值与特征向量
利用特征值与特征向量,可以把线性变换表达成简单而易于想象的形式。
1.1 特征值与特征向量
设
A
\bm{A}
A是数域
F
F
F上的
n
n
n阶方阵,如果有数
λ
∈
F
\lambda \in F
λ∈F及
F
F
F上的
n
n
n维列向量
X
=
(
x
1
,
.
.
.
,
x
n
)
T
≠
0
\bm{X} = (x_1, ..., x_n)^T \ne \bm{0}
X=(x1,...,xn)T=0,使得
A
X
=
λ
X
\bm{AX} = \lambda\bm{X}
AX=λX成立,则称
λ
\lambda
λ是
A
\bm{A}
A的一个特征值,非零向量
X
\bm{X}
X为
A
\bm{A}
A的述域特征值
λ
\lambda
λ的特征向量。上述式可以写为
(
λ
E
−
A
)
X
=
0
(\lambda\bm{E} - \bm{A})\bm{X} = 0
(λE−A)X=0由于
X
\bm{X}
X为非零向量,那么方程组有解的充要条件是
∣
λ
E
−
A
∣
=
0
|\lambda\bm{E} - \bm{A}| = 0
∣λE−A∣=0这是以
λ
\lambda
λ为未知数的一元n次方程,称为方阵
A
\bm{A}
A的特征方程。
∣
λ
E
−
A
∣
|\lambda\bm{E} - \bm{A}|
∣λE−A∣是关于
λ
\lambda
λ的n次多项式。
考虑将 ∣ λ E − A ∣ |\lambda\bm{E} - \bm{A}| ∣λE−A∣按照行列式的定义展开,那么其中一项为对角线元素的乘积 ∏ i = 1 n ( λ − a i i ) \prod_{i=1}^n(\lambda - a_{ii}) ∏i=1n(λ−aii)。而其余各项至多含有 n − 2 n-2 n−2个主对角线元素,即 λ \lambda λ的次数最多为 n − 2 n-2 n−2。故 λ n \lambda^n λn与 λ n − 1 \lambda^{n-1} λn−1仅存在于主对角线元素的乘积多项式中,展开得为 ∏ i = 1 n ( λ − a i i ) = λ n − ∑ i = 1 n a i i λ n − 1 + P n − 2 ( λ ) \prod_{i=1}^n(\lambda - a_{ii}) = \lambda^n - \sum_{i=1}^na_{ii}\lambda^{n-1} + P_{n-2}(\lambda) i=1∏n(λ−aii)=λn−i=1∑naiiλn−1+Pn−2(λ)其中, P n ( λ ) P_n(\lambda) Pn(λ)表示最高次数为 n n n的 λ \lambda λ的多项式。再考虑在 ∣ λ E − A ∣ |\lambda\bm{E} - \bm{A}| ∣λE−A∣中,令 λ = 0 \lambda = 0 λ=0,可以得到该式的常数项为 ∣ − A ∣ = ( − 1 ) n ∣ A ∣ |-\bm{A}| = (-1)^n|\bm{A}| ∣−A∣=(−1)n∣A∣,因此有 λ n − ∑ i = 1 n a i i λ n − 1 + P n − 2 ( λ ) + ( − 1 ) n ∣ A ∣ = 0 \lambda^n - \sum_{i=1}^na_{ii}\lambda^{n-1} + P_{n-2}(\lambda) + (-1)^n|\bm{A}| = 0 λn−i=1∑naiiλn−1+Pn−2(λ)+(−1)n∣A∣=0恒成立。根据多项式系数与根的关系,即对于 ∑ i = 0 n a n − i x i = 0 \sum_{i=0}^n a_{n-i}x^i= 0 ∑i=0nan−ixi=0,有 ∑ i = 1 n x i = − a 1 ∏ i = 1 n x i = ( − 1 ) n a n \sum_{i=1}^n x_i = -a_1 \\ \prod_{i=1}^nx_i = (-1)^na_n i=1∑nxi=−a1i=1∏nxi=(−1)nan那么有 ∑ i = 1 n λ i = ∑ i = 1 n a i i ∏ i = 1 n λ i = ∣ A ∣ \sum_{i=1}^n \lambda_i = \sum_{i=1}^na_{ii} \\ \prod_{i=1}^n \lambda_i = |\bm{A}| i=1∑nλi=i=1∑naiii=1∏nλi=∣A∣即矩阵的特征值之和等于矩阵的迹,矩阵的特征值之积等于矩阵的行列式。
若 λ \lambda λ是 A \bm{A} A的特征值,则 P n ( λ ) P_n(\lambda) Pn(λ)是 P n ( A ) P_n(\bm{A}) Pn(A)的特征值。考虑 A X = λ X \bm{AX} = \lambda\bm{X} AX=λX,那么 A n X = λ A n − 1 X = . . . = λ n X \bm{A}^n\bm{X} = \lambda\bm{A}^{n-1}\bm{X} = ... =\lambda^n\bm{X} AnX=λAn−1X=...=λnX。
设 λ 1 , . . . , λ m \lambda_1, ..., \lambda_m λ1,...,λm是n阶方阵 A \bm{A} A的m个特征值, X 1 , . . . , X m \bm{X}_1, ..., \bm{X}_m X1,...,Xm是依次与之对应的特征向量,若 λ 1 , . . . , λ m \lambda_1, ..., \lambda_m λ1,...,λm互不相等,则 X 1 , . . . , X m \bm{X}_1, ..., \bm{X}_m X1,...,Xm线性无关。
1.2 相似矩阵
设
A
\bm{A}
A,
B
\bm{B}
B都是n阶方阵,若存在可逆矩阵
T
\bm{T}
T,使得
B
=
T
−
1
A
T
\bm{B} = \bm{T}^{-1}\bm{AT}
B=T−1AT则称矩阵
A
\bm{A}
A和
B
\bm{B}
B相似,称
A
\bm{A}
A到
B
\bm{B}
B的变换称为相似变换。
考虑
A
\bm{A}
A和
B
\bm{B}
B相似,那么有
B
=
T
−
1
A
T
\bm{B} = \bm{T}^{-1}\bm{AT}
B=T−1AT,因此有
∣
λ
E
−
B
∣
=
∣
T
−
1
(
λ
E
)
T
−
T
−
1
A
T
∣
=
∣
T
−
1
(
λ
E
−
A
)
T
∣
=
∣
T
−
1
∣
∣
λ
E
−
A
∣
∣
T
∣
=
∣
λ
E
−
A
∣
\begin{aligned} |\lambda\bm{E} - \bm{B}|& = |\bm{T}^{-1}(\lambda\bm{E})\bm{T} - \bm{T}^{-1}\bm{AT}| \\ & = |\bm{T}^{-1}(\lambda\bm{E}-\bm{A})\bm{T}| \\ & = |\bm{T}^{-1}||\lambda\bm{E}-\bm{A}||\bm{T}| \\ & = |\lambda\bm{E}-\bm{A}| \end{aligned}
∣λE−B∣=∣T−1(λE)T−T−1AT∣=∣T−1(λE−A)T∣=∣T−1∣∣λE−A∣∣T∣=∣λE−A∣即
A
\bm{A}
A和
B
\bm{B}
B的特征值相同,但反之未必成立。因此,相似矩阵的迹与行列式也相等。
同样的,如果矩阵与对角矩阵相似,那么对角矩阵的元素就是矩阵的特征值。
1.3 相似对角化
n阶方阵
A
\bm{A}
A与对角矩阵相似的充要条件是
A
\bm{A}
A有
n
n
n个线性无关的特征向量,且
T
−
1
A
T
=
Λ
\bm{T}^{-1}\bm{AT} = \bm{\Lambda}
T−1AT=Λ,
T
\bm{T}
T的n个列向量是
A
\bm{A}
A的n个线性无关的特征向量,其对应的特征值是
Λ
\bm\Lambda
Λ的主对角线的元素。
考虑
T
=
(
T
1
,
.
.
.
,
T
n
)
\bm{T} = (\bm{T}_1, ..., \bm{T}_n)
T=(T1,...,Tn),使得
T
−
1
A
T
=
Λ
\bm{T}^{-1}\bm{AT} = \bm{\Lambda}
T−1AT=Λ,那么有
A
T
=
T
Λ
\bm{AT} = \bm{T}\bm{\Lambda}
AT=TΛ,而
A
T
=
(
A
T
1
,
.
.
.
,
A
T
n
)
T
Λ
=
(
λ
1
T
1
,
.
.
.
,
λ
n
T
n
)
\bm{AT} = (\bm{AT}_1, ... ,\bm{AT}_n) \\ \bm{T}\bm{\Lambda} = (\lambda_1\bm{T}_1, ...,\lambda_n\bm{T}_n)
AT=(AT1,...,ATn)TΛ=(λ1T1,...,λnTn)即
A
T
i
=
λ
i
T
i
\bm{AT}_i = \lambda_i\bm{T}_i
ATi=λiTi。因此
T
i
\bm{T}_i
Ti是
A
\bm{A}
A的线性无关的特征向量。而如果
A
\bm{A}
A的特征值互不相等,那么
A
\bm{A}
A与对角矩阵相似。
1.4 实对称矩阵
实对称矩阵是指实数域内的对称矩阵,其对应于不同特征值的特征向量必正交。考虑实对称矩阵
A
\bm{A}
A的两个不相等的特征值
λ
1
,
λ
2
\lambda_1, \lambda_2
λ1,λ2与对应的特征向量
X
1
,
X
2
\bm{X}_1,\bm{X}_2
X1,X2,那么有
A
X
1
=
λ
1
X
1
\bm{AX}_1 = \lambda_1\bm{X}_1
AX1=λ1X1,
A
X
2
=
λ
2
X
2
\bm{AX}_2 = \lambda_2\bm{X}_2
AX2=λ2X2。故有
λ
1
X
1
T
X
2
=
(
λ
1
X
1
)
T
X
2
=
(
A
X
1
)
T
X
2
=
X
1
T
A
T
X
2
=
X
1
T
(
A
X
2
)
=
X
1
T
(
λ
2
X
2
)
=
λ
2
X
1
T
X
2
\begin{aligned}\lambda_1\bm{X}^T_1\bm{X}_2 & = (\lambda_1\bm{X}_1)^T\bm{X}_2 \\ & = (\bm{AX}_1)^T\bm{X}_2 \\ & = \bm{X}_1^T\bm{A}^T\bm{X}_2 \\ & = \bm{X}_1^T(\bm{A}\bm{X}_2) \\ & = \bm{X}_1^T(\lambda_2\bm{X}_2) \\ & = \lambda_2\bm{X}_1^T\bm{X}_2 \end{aligned}
λ1X1TX2=(λ1X1)TX2=(AX1)TX2=X1TATX2=X1T(AX2)=X1T(λ2X2)=λ2X1TX2即
(
λ
1
−
λ
2
)
X
1
T
X
2
=
0
(\lambda_1 - \lambda_2)\bm{X}_1^T\bm{X}_2 = 0
(λ1−λ2)X1TX2=0因此
(
X
1
,
X
2
)
=
0
(\bm{X}_1, \bm{X}_2) = 0
(X1,X2)=0,两特征向量正交。
考虑实对称矩阵
A
\bm{A}
A,则存在正交矩阵
P
\bm{P}
P,使得
P
−
1
A
P
=
Λ
\bm{P}^{-1}\bm{AP} = \bm\Lambda
P−1AP=Λ
二、二次型
解析几何是用代数方法研究几何问题的数学分支。通过坐标,就可以将方程与几何图像对应起来。
2.1 二次型及其矩阵
含有n个变量
x
1
,
x
2
,
.
.
.
,
x
n
x_1, x_2, ..., x_n
x1,x2,...,xn而系数取自数域
F
F
F的n元二次齐次函数
f
(
x
1
,
x
2
,
.
.
.
,
x
n
)
=
a
1
1
x
1
2
+
2
a
12
x
1
x
2
+
.
.
.
+
2
a
1
n
x
1
x
n
+
a
2
2
x
2
2
+
.
.
.
+
2
a
2
n
x
2
x
n
+
.
.
.
+
a
n
n
x
n
2
\begin{aligned} f(x_1, x_2, ..., x_n) = a_11x_1^2 &+ 2a_{12}x_1x_2 &&+ ... &&&+ 2a_{1n}x_1x_n\\ & + a_22x_2^2 &&+ ... &&&+ 2a_{2n}x_2x_n \\ & + ... \\ & && &&& +a_{nn}x_n^2 \end{aligned}
f(x1,x2,...,xn)=a11x12+2a12x1x2+a22x22+...+...+...+2a1nx1xn+2a2nx2xn+annxn2称为数域
F
F
F上的n元二次型,简称二次型,可以通过矩阵记作
f
=
X
T
A
X
f = \bm{X}^T\bm{AX}
f=XTAX其中,
A
\bm{A}
A是对称矩阵,称为二次型
f
f
f的矩阵,其秩称为二次型
f
f
f的秩。
2.2 合同矩阵
考虑
X
\bm{X}
X是
R
n
\bm{R}^n
Rn中某一向量的坐标,而在另一坐标下的坐标为
Y
\bm{Y}
Y,则有过渡矩阵
C
\bm{C}
C,使得
Y
=
C
−
1
X
\bm{Y} = \bm{C}^{-1}\bm{X}
Y=C−1X那么二次型
f
=
X
T
A
X
f = \bm{X}^T\bm{AX}
f=XTAX在过渡矩阵
C
\bm{C}
C的作用下,有
f
=
Y
T
(
C
T
A
C
)
Y
f = \bm{Y}^T(\bm{C}^T\bm{AC})\bm{Y}
f=YT(CTAC)Y记
B
=
C
T
A
C
\bm{B} = \bm{C}^T\bm{AC}
B=CTAC,显然其是一个对称矩阵。这种关系反映了同一二次型在不同基下对应的矩阵之间的关系。
设
A
\bm{A}
A,
B
\bm{B}
B都是n阶方阵,若存在可逆矩阵
C
\bm{C}
C,使得
B
=
C
T
A
C
\bm{B} = \bm{C}^T\bm{AC}
B=CTAC则称矩阵
A
\bm{A}
A与
B
\bm{B}
B合同。
显然,实对称矩阵与对角矩阵合同。
2.3 标准形
给定二次型
f
=
X
T
A
X
f = \bm{X}^T\bm{AX}
f=XTAX,可以寻找适当的可逆线性变换
Y
=
C
−
1
X
\bm{Y} = \bm{C}^{-1}\bm{X}
Y=C−1X,使得
f
=
Y
T
Λ
Y
f = \bm{Y}^T\bm{\Lambda Y}
f=YTΛY此时的二次型展开仅有平方项,称为标准型。若
Λ
\bm\Lambda
Λ的元素值取值仅为-1,0和1,那么称该标准型为规范型。
考虑实对称矩阵
A
\bm{A}
A,那么存在正交矩阵
P
\bm{P}
P,使得
P
−
1
A
P
=
Λ
\bm{P}^{-1}\bm{AP} = \bm\Lambda
P−1AP=Λ。考虑
X
=
P
Y
\bm{X} = \bm{PY}
X=PY,那么有
f
=
X
T
A
X
=
Y
T
Λ
Y
f = \bm{X}^T\bm{AX} = \bm{Y}^T\bm{\Lambda Y}
f=XTAX=YTΛY
2.4 惯性定律
容易看出,给定二次型
f
f
f,其标准性不是唯一的。但在可逆线性变换下,同一个二次型的标准性中的系数正负性的个数不因变换的改变而改变。设二次型
f
=
X
T
A
X
f = \bm{X}^T\bm{AX}
f=XTAX经过可逆线性变换
X
=
C
1
Y
\bm{X} = \bm{C}_1\bm{Y}
X=C1Y与
X
=
C
2
Z
\bm{X} = \bm{C}_2\bm{Z}
X=C2Z,得到的标准型为
f
=
k
1
y
1
2
+
k
2
y
2
2
+
.
.
.
+
k
n
y
n
2
f
=
l
1
z
1
2
+
l
2
z
2
2
+
.
.
.
+
l
2
y
2
2
f = k_1y_1^2 + k_2y_2^2 + ... + k_ny_n^2 \\ f = l_1z_1^2 + l_2z_2^2 + ... + l_2y_2^2
f=k1y12+k2y22+...+knyn2f=l1z12+l2z22+...+l2y22其中系数
k
k
k与
l
l
l中的正数、负数、零值个数相等,称为惯性定律,正数与负数的个数称为正惯性指数与负惯性指数。其反映的几何意义为线性坐标变换不会改变几何图像的形态。
2.5 正定二次型
设n元二次型
f
=
X
T
A
X
f = \bm{X}^T\bm{AX}
f=XTAX对于
R
n
\bm{R}^n
Rn的任何列向量
X
≠
0
\bm{X} \ne \bm{0}
X=0都有
X
T
A
X
>
0
\bm{X}^T\bm{AX} > 0
XTAX>0,则称
f
f
f为正定二次型,矩阵
A
\bm{A}
A为正定矩阵。狭义的讲,正定矩阵一定是对称矩阵。n元正定二次型的正惯性指数为n。