Jordan标准形
定义7.1:称形如
J
(
λ
)
=
[
λ
1
λ
1
λ
1
⋱
⋱
λ
1
λ
]
r
×
r
J(\lambda)= \begin{bmatrix} \lambda&1\\ &\lambda&1\\ &&\lambda&1\\ &&&\ddots&\ddots\\ &&&&\lambda&1\\ &&&&&\lambda \end{bmatrix}_{r\times r}
J(λ)=⎣
⎡λ1λ1λ1⋱⋱λ1λ⎦
⎤r×r
的
r
r
r阶方阵为为一个
r
r
r阶 Jordan块。由Jordan块构成的准对角矩阵
J
=
[
J
1
(
λ
1
)
J
2
(
λ
2
)
J
3
(
λ
3
)
⋱
J
m
−
1
(
λ
m
−
1
)
J
m
(
λ
m
)
]
J= \begin{bmatrix} J_1(\lambda_1)\\ &J_2(\lambda_2)\\ &&J_3(\lambda_3)\\ &&&\ddots\\ &&&&J_{m-1}(\lambda_{m-1})\\ &&&&&J_m(\lambda_m) \end{bmatrix}
J=⎣
⎡J1(λ1)J2(λ2)J3(λ3)⋱Jm−1(λm−1)Jm(λm)⎦
⎤则称为 Jordan矩阵。
Remark:
Jordan矩阵不仅是准对角矩阵,也是上三角矩阵,主对角元素为自身的特征值。Jordan矩阵非零元素只存在于主对角线及其上方元素 a i , i + 1 a_{i,i+1} ai,i+1,并且 a i , i + 1 = 0 或 1 a_{i,i+1}=0或1 ai,i+1=0或1。另外注意,不同Jordan块并不要求特征值不同。
我们知道并不是所有的
n
n
n阶矩阵均可相似对角化,当且仅当其有
n
n
n个线性无关的特征向量才可实现。但是我们可以得到如下结论:
定理7.1:在复数域上,任意
n
n
n阶方阵
A
A
A均相似于一个Jordan矩阵
J
J
J,即存在
n
n
n阶可逆矩阵
P
P
P,使得:
P
−
1
A
P
=
J
=
[
J
1
(
λ
1
)
J
2
(
λ
2
)
J
3
(
λ
3
)
⋱
J
m
−
1
(
λ
m
−
1
)
J
m
(
λ
m
)
]
P^{-1}AP=J=\begin{bmatrix} J_1(\lambda_1)\\ &J_2(\lambda_2)\\ &&J_3(\lambda_3)\\ &&&\ddots\\ &&&&J_{m-1}(\lambda_{m-1})\\ &&&&&J_m(\lambda_m) \end{bmatrix}
P−1AP=J=⎣
⎡J1(λ1)J2(λ2)J3(λ3)⋱Jm−1(λm−1)Jm(λm)⎦
⎤称
J
J
J为
A
A
A的Jordan标准形。
下面分析Jordan标准型的求解方法:
设 A n × n ∼ J A A_{n\times n}\sim J_A An×n∼JA,则 J A J_A JA 与 A A A 有相同的特征值,即 A A A 的特征值为 J A J_A JA 的主对角元素。
记
A
的
k
i
重特征值为
λ
i
(
i
=
1
,
2
,
…
,
s
;
∑
i
=
1
s
k
i
=
n
)
A 的 k_i 重特征值为 \lambda_i (i=1,2,\dots,s;\sum_{i=1}^s k_i=n)
A的ki重特征值为λi(i=1,2,…,s;i=1∑ski=n)那么将
J
A
J_A
JA 具有相同特征值的Jordan块排在一块有:
J
A
=
[
A
1
(
λ
1
)
k
1
×
k
1
A
2
(
λ
2
)
k
2
×
k
2
⋱
A
s
(
λ
s
)
k
s
×
k
s
]
n
×
n
其中
,
A
i
(
λ
i
)
包含
1
≤
t
i
≤
k
i
个
J
o
r
d
a
n
块
,
各
J
o
r
d
a
n
块的阶数为
n
(
i
,
j
)
,则
(
∑
j
=
1
t
i
n
(
i
,
j
)
=
k
i
)
,即
A
i
(
λ
i
)
=
[
J
1
(
λ
i
)
n
(
i
,
1
)
×
n
(
i
,
1
)
J
2
(
λ
i
)
n
(
i
,
2
)
×
n
(
i
,
2
)
⋱
J
t
i
(
λ
i
)
n
(
i
,
t
i
)
×
n
(
i
,
t
i
)
]
k
i
×
k
i
(
i
=
1
,
2
,
…
,
s
)
J_A=\begin{bmatrix} A_1(\lambda_1)_{k_1\times k_1}\\ &A_2(\lambda_2)_{k_2\times k_2}\\ &&\ddots\\ &&&A_s(\lambda_s)_{k_s\times k_s} \end{bmatrix}_{n\times n}其中,A_i(\lambda_i)包含1\le t_{i}\le k_i个Jordan块,各Jordan块的阶数为n_{(i,j)},则(\sum_{j=1}^{t_i} n_{(i,j)}=k_i),即A_i(\lambda_i)=\begin{bmatrix} J_{1}(\lambda_i)_{n_{(i,1)}\times n_{(i,1)}}\\ &J_{2}(\lambda_i)_{n_{(i,2)}\times n_{(i,2)}}\\ &&\ddots\\ &&&J_{t_{i}}(\lambda_i)_{n_{(i,t_{i})}\times n_{(i,t_{i})}} \end{bmatrix}_{k_i\times k_i}\quad (i=1,2,\dots,s)
JA=⎣
⎡A1(λ1)k1×k1A2(λ2)k2×k2⋱As(λs)ks×ks⎦
⎤n×n其中,Ai(λi)包含1≤ti≤ki个Jordan块,各Jordan块的阶数为n(i,j),则(j=1∑tin(i,j)=ki),即Ai(λi)=⎣
⎡J1(λi)n(i,1)×n(i,1)J2(λi)n(i,2)×n(i,2)⋱Jti(λi)n(i,ti)×n(i,ti)⎦
⎤ki×ki(i=1,2,…,s)
由
A
n
×
n
∼
J
A
A_{n\times n}\sim J_A
An×n∼JA ,则
P
−
1
A
P
=
J
A
⟹
A
P
=
P
J
A
⟹
A
[
p
n
×
k
1
1
,
p
n
×
k
2
2
,
…
,
p
n
×
k
s
s
]
=
[
p
n
×
k
1
1
,
p
n
×
k
2
2
,
…
,
p
n
×
k
s
s
]
[
A
1
(
λ
1
)
k
1
×
k
1
A
2
(
λ
2
)
k
2
×
k
2
⋱
A
s
(
λ
s
)
k
s
×
k
s
]
n
×
n
=
[
p
n
×
k
1
1
A
1
(
λ
1
)
k
1
×
k
1
,
p
n
×
k
2
2
A
2
(
λ
2
)
k
2
×
k
2
,
…
,
p
n
×
k
s
s
A
s
(
λ
s
)
k
s
×
k
s
]
P^{-1}AP=J_A\Longrightarrow AP=PJ_A\Longrightarrow A[p^1_{n\times{k_1}},p^2_{n\times{k_2}},\dots,p^s_{n\times{k_s}}]=[p^1_{n\times{k_1}},p^2_{n\times{k_2}},\dots,p^s_{n\times{k_s}}]\begin{bmatrix} A_1(\lambda_1)_{k_1\times k_1}\\ &A_2(\lambda_2)_{k_2\times k_2}\\ &&\ddots\\ &&&A_s(\lambda_s)_{k_s\times k_s} \end{bmatrix}_{n\times n}= [p^1_{n\times{k_1}}A_1(\lambda_1)_{k_1\times k_1},p^2_{n\times{k_2}}A_2(\lambda_2)_{k_2\times k_2},\dots,p^s_{n\times{k_s}}A_s(\lambda_s)_{k_s\times k_s}]
P−1AP=JA⟹AP=PJA⟹A[pn×k11,pn×k22,…,pn×kss]=[pn×k11,pn×k22,…,pn×kss]⎣
⎡A1(λ1)k1×k1A2(λ2)k2×k2⋱As(λs)ks×ks⎦
⎤n×n=[pn×k11A1(λ1)k1×k1,pn×k22A2(λ2)k2×k2,…,pn×kssAs(λs)ks×ks]即:
A
p
n
×
k
r
r
=
p
n
×
k
r
r
A
r
(
λ
r
)
k
r
×
k
r
(
r
=
1
,
2
,
…
,
s
)
Ap^r_{n\times{k_r}}=p^r_{n\times{k_r}}A_r(\lambda_r)_{k_r\times k_r}\quad (r=1,2,\dots,s)
Apn×krr=pn×krrAr(λr)kr×kr(r=1,2,…,s)
进一步,对
p
n
×
k
r
r
p^r_{n\times{k_r}}
pn×krr进行列分块:
A
[
P
˜
n
×
n
(
r
,
1
)
r
1
,
P
˜
n
×
n
(
r
,
2
)
r
2
,
…
,
P
˜
n
×
n
(
r
,
t
r
)
r
k
r
]
=
[
P
˜
n
×
n
(
r
,
1
)
r
1
,
P
˜
n
×
n
(
r
,
2
)
r
2
,
…
,
P
˜
n
×
n
(
r
,
t
r
)
r
k
r
]
[
J
1
(
λ
r
)
n
(
r
,
1
)
×
n
(
r
,
1
)
J
2
(
λ
r
)
n
(
r
,
2
)
×
n
(
r
,
2
)
⋱
J
t
r
(
λ
r
)
n
(
r
,
t
r
)
×
n
(
r
,
t
r
)
]
k
r
×
k
r
=
[
P
˜
r
1
J
1
(
λ
r
)
,
P
˜
r
2
J
2
(
λ
r
)
,
…
,
P
˜
r
k
r
J
t
r
(
λ
r
)
]
A[{\~P}^{r1}_{n\times n_{(r,1)}},{\~P}^{r2}_{n\times n_{(r,2)}},\dots,{\~P}^{rk_r}_{n\times n_{(r,t_r)}}]=[{\~P}^{r1}_{n\times n_{(r,1)}},{\~P}^{r2}_{n\times n_{(r,2)}},\dots,{\~P}^{rk_r}_{n\times n_{(r,t_r)}}] \begin{bmatrix} J_{1}(\lambda_r)_{n_{(r,1)}\times n_{(r,1)}}\\ &J_{2}(\lambda_r)_{n_{(r,2)}\times n_{(r,2)}}\\ &&\ddots\\ &&&J_{t_{r}}(\lambda_r)_{n_{(r,t_{r})}\times n_{(r,t_{r}})} \end{bmatrix}_{k_r\times k_r}= [{\~P}^{r1}J_{1}(\lambda_r),{\~P}^{r2}J_{2}(\lambda_r),\dots,{\~P}^{rk_r}J_{t_{r}}(\lambda_r)]
A[P˜n×n(r,1)r1,P˜n×n(r,2)r2,…,P˜n×n(r,tr)rkr]=[P˜n×n(r,1)r1,P˜n×n(r,2)r2,…,P˜n×n(r,tr)rkr]⎣
⎡J1(λr)n(r,1)×n(r,1)J2(λr)n(r,2)×n(r,2)⋱Jtr(λr)n(r,tr)×n(r,tr)⎦
⎤kr×kr=[P˜r1J1(λr),P˜r2J2(λr),…,P˜rkrJtr(λr)]即:
A
P
˜
n
×
n
(
r
,
l
)
r
l
=
P
˜
n
×
n
(
r
,
l
)
r
l
J
l
(
λ
r
)
n
(
r
,
l
)
×
(
r
,
l
)
(
l
=
1
,
2
,
…
,
t
r
)
A{\~P}^{rl}_{n\times n_{(r,l)}}={\~P}^{rl}_{n\times n_{(r,l)}}J_{l}(\lambda_r)_{n_{(r,l)\times(r,l)}}\quad(l=1,2,\dots,t_r)
AP˜n×n(r,l)rl=P˜n×n(r,l)rlJl(λr)n(r,l)×(r,l)(l=1,2,…,tr)
进一步分块有:
A
[
α
⃗
,
β
⃗
2
,
…
,
β
⃗
n
(
r
,
t
r
)
]
=
[
α
⃗
,
β
⃗
2
,
…
,
β
⃗
n
(
r
,
t
r
)
]
[
λ
1
λ
1
λ
1
⋱
⋱
λ
1
λ
]
n
(
r
,
l
)
×
(
r
,
l
)
A[\vec{\alpha},\vec{\beta}_2,\dots,\vec{\beta}_{n_{(r,tr)}}]=[\vec{\alpha},\vec{\beta}_2,\dots,\vec{\beta}_{n_{(r,tr)}}]\begin{bmatrix} \lambda&1\\ &\lambda&1\\ &&\lambda&1\\ &&&\ddots&\ddots\\ &&&&\lambda&1\\ &&&&&\lambda \end{bmatrix}_{n_{(r,l)\times(r,l)}}
A[α,β2,…,βn(r,tr)]=[α,β2,…,βn(r,tr)]⎣
⎡λ1λ1λ1⋱⋱λ1λ⎦
⎤n(r,l)×(r,l)即:
{
(
A
−
λ
E
)
α
⃗
=
0
(
A
−
λ
E
)
β
⃗
2
=
α
⃗
(
A
−
λ
E
)
β
⃗
3
=
β
⃗
2
…
(
A
−
λ
E
)
β
⃗
n
(
r
,
t
r
)
=
β
⃗
(
n
(
r
,
t
r
)
−
1
)
(
1
)
\begin{cases} (A-\lambda E)\vec{\alpha}=0\\ (A-\lambda E)\vec{\beta}_2=\vec{\alpha}\\ (A-\lambda E)\vec{\beta}_3=\vec{\beta}_2\\ \dots\\ (A-\lambda E)\vec{\beta}_{n_{(r,t_r)}}=\vec{\beta}_{(n_{(r,t_r)}-1)}\\ \end{cases}\qquad(1)
⎩
⎨
⎧(A−λE)α=0(A−λE)β2=α(A−λE)β3=β2…(A−λE)βn(r,tr)=β(n(r,tr)−1)(1)
将
{
α
⃗
,
β
⃗
2
,
…
,
β
⃗
n
(
r
,
t
r
)
}
\{\vec{\alpha},\vec{\beta}_2,\dots,\vec{\beta}_{n_{(r,tr)}}\}
{α,β2,…,βn(r,tr)}称作Jotdan链,它们是同一特征值对应的某个Jordan块对应的可逆矩阵
P
P
P的列
综上,求解可逆矩阵
P
P
P与Jordan标准形
J
A
J_A
JA的步骤如下:
(1) 求解
A
A
A的特征多项式,得到
k
i
k_i
ki重特征值
λ
i
(
i
=
1
,
2
,
…
,
s
)
\lambda_i\ (i=1,2,\dots,s)
λi (i=1,2,…,s);
(2) 求解其中一个特征值
λ
i
\lambda_i
λi对应的所有线性无关的特征向量
α
⃗
j
(
j
=
1
,
2
,
…
,
t
i
)
\vec{\alpha}_j\ (j=1,2,\dots,t_i)
αj (j=1,2,…,ti);
(3) 将每个特征向量
α
⃗
j
\vec{\alpha}_j
αj分别代入方程
(
1
)
(1)
(1)得到一个Jordan链;
(4) 对应排列Jordan链与相应的Jordan块得到P与Jordan标准形。