矩阵论(二)——Jordan标准形

1. 线性变换的对角矩阵表示

1.1 特征值与特征向量

1.  ∃ ϵ ∈ V n ( F ) 且 λ ∈ F , ϵ ≠ 0 , 使 T ( ϵ ) = λ ϵ \exist \epsilon \in V_n(F)且\lambda \in F,\epsilon \neq 0,使T(\epsilon) = \lambda \epsilon ϵVn(F)λFϵ=0使T(ϵ)=λϵ,则 λ \lambda λ是T的特征值,向量 ϵ \epsilon ϵ是线性变换T对应于 λ \lambda λ特征向量
证明:
ϵ = ( α 1 α 2 ⋯ α n ) X \epsilon = (\alpha_1 \quad \alpha_2 \quad \cdots \alpha_n) X ϵ=(α1α2αn)X

T ( ϵ ) = ( α 1 α 2 ⋯ α n ) A X T(\epsilon) = (\alpha_1 \quad \alpha_2 \quad \cdots \alpha_n) AX T(ϵ)=(α1α2αn)AX

因此 T ( ϵ ) = λ ϵ    ⟺    A X = λ X T(\epsilon) = \lambda \epsilon \iff AX = \lambda X T(ϵ)=λϵAX=λX

2.  线性变换T在基 { α 1 α 2 ⋯ α n } \{\alpha_1 \quad \alpha_2 \quad \cdots \alpha_n\} {α1α2αn}下矩阵为A,则A的特征值是T的特征值;若X是A的特征向量,则 ϵ = ( α 1 α 2 ⋯ α n ) X \epsilon = (\alpha_1 \quad \alpha_2 \quad \cdots \alpha_n) X ϵ=(α1α2αn)X是T的特征向量
T的特征值由T决定,和基与变换矩阵的选择无关
不同特征值对应的特征向量必线性无关

1.2 特征子空间

概念

λ \lambda λ是线性变换T的特征值, ϵ 1 ,   ϵ 2 ,   ⋯   ,   ϵ t \epsilon_1,\ \epsilon_2,\ \cdots,\ \epsilon_t ϵ1, ϵ2, , ϵt是T对应于 λ \lambda λ的特征向量的极大线性无关组,则称子空间 V λ = L { ϵ 1 ,   ϵ 2 ,   ⋯   ,   ϵ t } V_\lambda = L\{\epsilon_1,\ \epsilon_2,\ \cdots,\ \epsilon_t\} Vλ=L{ϵ1, ϵ2, , ϵt}为T关于 λ \lambda λ特征子空间
∀ α ∈ V λ ,   α ≠ 0 ,   α \forall \alpha \in V_\lambda,\ \alpha \neq 0,\ \alpha αVλ, α=0, α就是T关于 λ \lambda λ的特征向量, V λ = N ( T − λ I ) V_\lambda=N(T - \lambda I) Vλ=N(TλI)
若T有s个互异的特征值,则它们就对应s个特征子空间
奇异矩阵: 该矩阵的秩不是满秩

性质

λ 1 ,   λ 2 ,   ⋯   ,   λ s 是 V n ( F ) \lambda_1,\ \lambda_2,\ \cdots,\ \lambda_s是V_n(F) λ1, λ2, , λsVn(F)上线性变换T的s个互异的特征值, V λ i V_{\lambda_i} Vλi λ i \lambda_i λi的特征子空间,则
V λ i \quad V_{\lambda_i} Vλi是T的不变子空间
λ i ≠ λ j 时 , V λ i ∩ V λ j = { 0 } \quad \lambda_i \neq \lambda_j时,V_{\lambda_i} \cap V_{\lambda_j} = \{0\} λi=λjVλiVλj={0}
若 λ i \quad 若\lambda_i λi是T的k重特征值,则 d i m V λ i ≤ k dimV_{\lambda_i} \leq k dimVλik

V λ 1 + V λ 2 + ⋯ + V λ s = V λ 1 ⨁ V λ 2 ⨁ ⋯ ⨁ V λ s ⊂ V n ( F ) V_{\lambda_1} + V_{\lambda_2} + \cdots + V_{\lambda_s} = V_{\lambda_1} \bigoplus V_{\lambda_2} \bigoplus \cdots \bigoplus V_{\lambda_s} \subset V_n(F) Vλ1+Vλ2++Vλs=Vλ1Vλ2VλsVn(F)

∑ i = 1 s d i m V λ i ≤ d i m V n ( F ) = n \sum^s_{i = 1} dimV_{\lambda_i} \leq dimV_n(F) = n i=1sdimVλidimVn(F)=n

∑ i = 1 s d i m V λ i = n ⇒ V λ 1 ⨁ V λ 2 ⨁ ⋯ ⨁ V λ s = V n ( F ) \sum^s_{i = 1} dimV_{\lambda_i} = n \Rightarrow V_{\lambda_1} \bigoplus V_{\lambda_2} \bigoplus \cdots \bigoplus V_{\lambda_s} = V_n(F) i=1sdimVλi=nVλ1Vλ2Vλs=Vn(F)

例题

例题一
在这里插入图片描述
例题二
在这里插入图片描述
在这里插入图片描述

1.3 线性变换矩阵的对角化

概念

线性变换T有对角矩阵    ⟺    \iff T有n个线性无关的特征向量    ⟺    \iff V λ 1 ⨁ V λ 2 ⨁ ⋯ ⨁ V λ s = V n ( F ) V_{\lambda_1} \bigoplus V_{\lambda_2} \bigoplus \cdots \bigoplus V_{\lambda_s} = V_n(F) Vλ1Vλ2Vλs=Vn(F)    ⟺    \iff m ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ s ) m(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) \cdots (\lambda - \lambda_s) m(λ)=(λλ1)(λλ2)(λλs)
V λ 1 ⨁ V λ 2 ⨁ ⋯ ⨁ V λ s = V n ( F ) V_{\lambda_1} \bigoplus V_{\lambda_2} \bigoplus \cdots \bigoplus V_{\lambda_s} = V_n(F) Vλ1Vλ2Vλs=Vn(F)    ⟺    \iff λ i 是 T 的 k i 重 特 征 值 , 必 有 d i m V λ i = k i ,   i = 1 ,   2 ,   ⋯   ,   n \lambda_i是T的k_i重特征值,必有dimV_{\lambda_i} = k_i,\ i = 1,\ 2,\ \cdots,\ n λiTkidimVλi=ki, i=1, 2, , n
λ i \lambda_i λi为T的单特征值,则必有 d i m V λ i = 1 dimV_{\lambda_i} = 1 dimVλi=1
线性变换T有n个互异的特征值 λ 1 ,   λ 2 ,   ⋯   ,   λ n \lambda_1,\ \lambda_2,\ \cdots,\ \lambda_n λ1, λ2, , λn ⇒ \Rightarrow V λ 1 ⨁ V λ 2 ⨁ ⋯ ⨁ V λ s = V n ( F ) V_{\lambda_1} \bigoplus V_{\lambda_2} \bigoplus \cdots \bigoplus V_{\lambda_s} = V_n(F) Vλ1Vλ2Vλs=Vn(F)
V n ( F ) V_n(F) Vn(F)上线性变换有对角矩阵表示    ⟺    \iff V n ( F ) V_n(F) Vn(F)可分解为T的一维不变子空间的直和

例题

例题一
在这里插入图片描述
例题二
在这里插入图片描述
在这里插入图片描述

2 Jordan矩阵介绍

2.1 Jordan矩阵

J ( λ ) = [ λ 1 λ 1 ⋱ 1 λ ] J(\lambda) = \begin{bmatrix} \lambda & 1 & & \\ & \lambda & 1 \\ & & \ddots &1 \\ & & & \lambda \end{bmatrix} J(λ)=λ1λ11λ

的r阶方阵称为一个r阶Jordan块。由若干个Jordan块 J i ( λ i ) J_i(\lambda_i) Ji(λi)构成的准对角矩阵
J = [ J 1 ( λ 1 ) J 2 ( λ 2 ) ⋱ J m ( λ m ) ] J = \begin{bmatrix} J_1(\lambda_1) & & & \\ & J_2(\lambda_2) & & \\ & & \ddots & \\ & & & J_m(\lambda_m) \end{bmatrix} J=J1(λ1)J2(λ2)Jm(λm)
称为Jordan矩阵
Jordan块都是一阶的Jordan矩阵就是对角矩阵

在复数域C上,每个n阶方阵A都相似于一个Jordan矩阵,即存在可逆矩阵P,使
P − 1 A P = J A = [ J 1 ( λ 1 ) J 2 ( λ 2 ) ⋱ J s ( λ s ) ] P^{-1}AP = J_A = \begin{bmatrix} J_1(\lambda_1) & & & \\ & J_2(\lambda_2) & & \\ & & \ddots & \\ & & & J_s(\lambda_s) \end{bmatrix} P1AP=JA=J1(λ1)J2(λ2)Js(λs)

其中
J i ( λ i ) = [ J i 1 ( λ i ) J i 2 ( λ i ) ⋱ J i t i ( λ i ) ] ∈ C k i ∗ k i J_i(\lambda_i) = \begin{bmatrix} J_{i_1}(\lambda_i) & & & \\ & J_{i_2}(\lambda_i) & & \\ & & \ddots & \\ & & & J_{i_{t_i}}(\lambda_i) \end{bmatrix} \in C^{k_i * k_i} Ji(λi)=Ji1(λi)Ji2(λi)Jiti(λi)Ckiki

J i j ( λ i ) 为 n j J_{ij}(\lambda_i)为n_j Jij(λi)nj阶Jordan块, ∑ j = 1 t i n j = k i \sum^{t_i}_{j = 1} n_j = k_i j=1tinj=ki. J i ( λ i ) 是 k i ∗ k i J_i(\lambda_i)是k_i * k_i Ji(λi)kiki阶Jordan矩阵, ∑ i = 1 s k i = n \sum^s_{i = 1} k_i = n i=1ski=n
若不计较Jordan的排列次序,则每个方阵的Jordan标准形 J A J_A JA唯一

2.2 Jordan标准形

计算步骤

  1. 求A的特征多项式
    ∣ λ I − A ∣ = ( λ − λ 1 ) k 1 ( λ − λ 2 ) k 2 ⋯ ( λ − λ s ) k s |\lambda I - A| = (\lambda - \lambda_1) ^ {k_1} (\lambda - \lambda_2) ^ {k_2} \cdots (\lambda - \lambda_s) ^ {k_s} λIA=(λλ1)k1(λλ2)k2(λλs)ks 代数重数 k i k_i ki决定Jordan矩阵 J i ( λ i ) J_i(\lambda_i) Ji(λi)的阶数为 k i k_i ki
  2. λ i \lambda_i λi,由 ( A − λ i I ) X = 0 (A - \lambda_i I)X = 0 (AλiI)X=0,求A的线性无关的特征向量 α 1 ,   α 2 ,   ⋯   ,   α t i \alpha_1,\ \alpha_2,\ \cdots,\ \alpha_{t_i} α1, α2, , αti λ i \lambda_i λi的几何重数 d i m V λ i = t i dimV_{\lambda_i} = t_i dimVλi=ti决定 J i ( λ i ) J_i(\lambda_i) Ji(λi)中有 t i t_i ti个Jordan块
  3. λ i \lambda_i λi的代数重数( k i k_i ki)等于几何重数( d i m V λ i dimV_{\lambda_i} dimVλi): k i = d i m V λ i k_i = dimV_{\lambda_i} ki=dimVλi λ i \lambda_i λi对应的Jordan矩阵为 k i k_i ki阶对角矩阵;若 d i m V λ i = t i < k i dim V_{\lambda_i} = t_i < k_i dimVλi=ti<ki,则在 V λ i V_{\lambda_i} Vλi中选择适当的特征向量 α i \alpha_i αi,求Jordan链 α i ,   β 2 ,   ⋯   ,   β n i \alpha_i,\ \beta_2,\ \cdots,\ \beta_{n_i} αi, β2, , βni,确定 J i ( λ i ) J_i(\lambda_i) Ji(λi)中Jordan块 J i j ( λ i ) J_{ij}(\lambda_i) Jij(λi)的阶数 n i n_i ni,从而得到 J A J_A JA的结构
  4. 所有Jordan链构成矩阵P,必有 P − 1 A P = J A P^{-1}AP = J_A P1AP=JA

推导过程

设A的特征多项式为 ∣ λ I − A ∣ = ( λ − λ 1 ) k 1 ( λ − λ 2 ) k 2 ⋯ ( λ − λ s ) k s |\lambda I - A| = (\lambda - \lambda_1) ^ {k_1} (\lambda - \lambda_2) ^ {k_2} \cdots (\lambda - \lambda_s)^{k_s} λIA=(λλ1)k1(λλ2)k2(λλs)ks其中 λ i 是 A 的 k i 重 特 征 值 , ∑ i = 1 s k i = n ,   λ 1 ,   λ 2 ,   ⋯   ,   λ s 互 异 \lambda_i是A的k_i重特征值,\sum^s_{i = 1} k_i = n,\ \lambda_1,\ \lambda_2,\ \cdots,\ \lambda_s互异 λiAkii=1ski=n, λ1, λ2, , λs
⇒ \Rightarrow
J A = [ J 1 ( λ 1 ) J 2 ( λ 2 ) ⋱ J s ( λ s ) ] ( 2.5 ) J_A = \begin{bmatrix} J_1(\lambda_1) & & & \\ & J_2(\lambda_2) & & \\ & & \ddots & \\ & & & J_s(\lambda_s) \end{bmatrix} \qquad \qquad \qquad (2.5) JA=J1(λ1)J2(λ2)Js(λs)(2.5)

J i ( λ i ) J_i(\lambda_i) Ji(λi)是主对角线元素为 λ i \lambda_i λi k i k_i ki阶Jordan矩阵
P = ( p 1 ,   p 2 ,   ⋯   ,   p s ) ,   p i ∈ C n ∗ k i ,   i = 1 ,   2 ,   ⋯   ,   s ,   A P = P J A P = (p_1,\ p_2,\ \cdots,\ p_s),\ p_i \in C ^ {n * k_i},\ i = 1,\ 2,\ \cdots,\ s,\ AP = PJ_A P=(p1, p2, , ps), piCnki, i=1, 2, , s, AP=PJA可表示为:
A ( p 1 p 2 ⋯ p s ) = ( p 1 p 2 ⋯ p s ) [ J 1 ( λ 1 ) J 2 ( λ 2 ) ⋱ J s ( λ s ) ] A(p_1 \quad p_2 \quad \cdots \quad p_s) = (p_1 \quad p_2 \quad \cdots \quad p_s) \begin{bmatrix} J_1(\lambda_1) & & & \\ & J_2(\lambda_2) & & \\ & & \ddots & \\ & & & J_s(\lambda_s) \end{bmatrix} A(p1p2ps)=(p1p2ps)J1(λ1)J2(λ2)Js(λs)

⇒ \Rightarrow
( A p 1 A p 2 ⋯ A p s ) = ( p 1 J 1 ( λ 1 ) p 2 J 2 ( λ 2 ) ⋯ p s J s ( λ s ) ) (A p_1 \quad A p_2 \quad \cdots \quad A p_s) = (p_1 J_1(\lambda_1) \quad p_2 J_2(\lambda_2) \quad \cdots \quad p_s J_s(\lambda_s)) (Ap1Ap2Aps)=(p1J1(λ1)p2J2(λ2)psJs(λs))

⇒ \Rightarrow
A p i = p i J i ( λ i ) , i = 1 ,   2 ,   ⋯   ,   s ( 2.6 ) A p_i = p_i J_i(\lambda_i), \quad i = 1,\ 2,\ \cdots,\ s \qquad \qquad \qquad (2.6) Api=piJi(λi),i=1, 2, , s(2.6)
A p 1 = p 1 J 1 ( λ 1 ) A p_1 = p_1 J_1(\lambda_1) Ap1=p1J1(λ1)为代表来分析,设
J 1 ( λ 1 ) = [ J 11 ( λ 1 ) J 12 ( λ 1 ) ⋱ J 1 t ( λ 1 ) ] J_1(\lambda_1) = \begin{bmatrix} J_{11}(\lambda_1) & & & \\ & J_{12}(\lambda_1) & & \\ & & \ddots & \\ & & & J_{1t}(\lambda_1) \end{bmatrix} J1(λ1)=J11(λ1)J12(λ1)J1t(λ1

其中 J 1 i 为 n i J_{1i}为n_i J1ini阶Jordan块, ∑ i = 1 t n i = k 1 \sum^t_{i =1} n_i = k_1 i=1tni=k1
⇒ \Rightarrow
J 1 i ( λ 1 ) = [ λ 1 1 λ 1 1 ⋱ ⋱ 1 λ 1 ] n i ∗ n i ( 2.7 ) J_{1i}(\lambda_1) = \begin{bmatrix} \lambda_1 & 1 & & & \\ & \lambda_1 & 1 & & \\ & & & \ddots & \\ & & & \ddots & 1\\ & & & & \lambda_1 \end{bmatrix}_{n_i * n_i} \qquad \qquad \qquad (2.7) J1i(λ1)=λ11λ111λ1nini(2.7)
p 1 p_1 p1 n 1 列 ,   n 2 列 ,   ⋯   ,   n t 列 分 块 , p 1 = ( p 1 ( 1 ) p 2 ( 1 ) ⋯ p t ( 1 ) ) n_1列,\ n_2列,\ \cdots,\ n_t列分块,\quad p_1 = (p^{(1)}_1 \quad p^{(1)}_2 \quad \cdots p^{(1)}_t) n1, n2, , nt,p1=(p1(1)p2(1)pt(1))
由等式2.6有 A p j ( 1 ) = p 1 ( 1 ) J 1 j ( λ 1 ) , j = 1 ,   2 ,   ⋯   ,   t ( 2.8 ) A p^{(1)}_j = p^{(1)}_1 J_{1j}(\lambda_1), \quad j = 1,\ 2,\ \cdots,\ t \qquad \qquad \qquad (2.8) Apj(1)=p1(1)J1j(λ1),j=1, 2, , t(2.8)

p j ( 1 ) = ( α 1 β 2 ⋯ β n j ) p^{(1)}_j = (\alpha_1 \quad \beta_2 \quad \cdots \quad \beta_{n_j}) pj(1)=(α1β2βnj),结合等式2.7,等式2.8可化为
A ( α 1 β 2 ⋯ β n j ) = ( α 1 β 2 ⋯ β n j ) [ λ 1 1 λ 1 1 ⋱ ⋱ 1 λ 1 ] A(\alpha_1 \quad \beta_2 \quad \cdots \beta_{n_j}) = (\alpha_1 \quad \beta_2 \cdots \beta_{n_j}) \begin{bmatrix} \lambda_1 & 1 & & & \\ & \lambda_1 & 1 & & \\ & & & \ddots & \\ & & & \ddots & 1 & \\ & & & & \lambda_1 \end{bmatrix} A(α1β2βnj)=(α1β2βnj)λ11λ111λ1
该矩阵等式等价于
{ ( A − λ 1 I ) α 1 = 0 ( A − λ 1 I ) β 2 = α 1 ( A − λ 1 I ) β 3 = β 2 ⋮ ( A − λ 1 I ) β n j = β n j − 1 ( 2.9 ) \begin{cases} (A - \lambda_1I)\alpha_1 = 0 \\ (A - \lambda_1I)\beta_2 = \alpha_1 \\ (A - \lambda_1I)\beta_3 = \beta_2 \\ \qquad \vdots \\ (A - \lambda_1I)\beta_{n_j} = \beta_{n_{j - 1}} \end{cases} \qquad \qquad \qquad (2.9) (Aλ1I)α1=0(Aλ1I)β2=α1(Aλ1I)β3=β2(Aλ1I)βnj=βnj1(2.9)

从等式2.9中求得一组向量 { α 1 ,   β 2 ,   ⋯   ,   β n j } \{\alpha_1,\ \beta_2,\ \cdots,\ \beta_{n_j}\} {α1, β2, , βnj},称为Jordan链。链中第一个向量 α 1 \alpha_1 α1是A关于 λ 1 \lambda_1 λ1的特征向量, β 2 ,   ⋯   ,   β n j \beta_2,\ \cdots,\ \beta_{n_j} β2, , βnj称为广义特征向量它的长度 n j n_j nj就是 J 1 j ( λ 1 ) J_{1j}(\lambda_1) J1j(λ1)的阶数
等式2.8 ⇒ n u m ( J 1 j ( λ 1 ) ) = n u m ( J o r d a n 链 ) = n u m ( α ) \Rightarrow num(J_{1j}(\lambda_1)) = num(Jordan链) = num(\alpha) num(J1j(λ1))=num(Jordan)=num(α),num表示总数量。用文字可以表述为:
由等式2.8可知, J 1 ( λ 1 ) J_1(\lambda_1) J1(λ1)有多少个Jordan块 J 1 j ( λ 1 ) J_{1j}(\lambda_1) J1j(λ1),就有多少条Jordan链,也就会有多少个线性无关的特征向量

例题

例题一
在这里插入图片描述
例题二
在这里插入图片描述
在这里插入图片描述

例题三
在这里插入图片描述
在这里插入图片描述

3. 最小多项式

3.1 矩阵多项式

A ∈ F n × n ,   a i ∈ F ,   g ( λ ) = a m λ m + a m − 1 λ m − 1 + ⋯ + a 1 λ + a 0 A \in F^{n \times n},\ a_i \in F,\ g(\lambda) = a_m \lambda^m + a_{m - 1} \lambda^{m -1} + \cdots +a_1 \lambda + a_0 AFn×n, aiF, g(λ)=amλm+am1λm1++a1λ+a0是一个多项式,则称矩阵 g ( A ) = a m A m + a m − 1 A m − 1 + ⋯ + a 1 A + a 0 I g(A) = a_m A^m + a_{m - 1} A^{m - 1} + \cdots + a_1 A + a_0 I g(A)=amAm+am1Am1++a1A+a0I为A的矩阵多项式

A ∈ F n × n A \in F ^ {n \times n} AFn×n,g(A)是A的矩阵多项式,则:

  1. λ 0 \lambda_0 λ0是A的特征值 ⇒ \Rightarrow g ( λ 0 ) g(\lambda_0) g(λ0)是g(A)的特征值
  2. P − 1 A P = B ⇒ P − 1 g ( A ) P = g ( B ) P^{-1}AP = B \Rightarrow P^{-1} g(A) P = g(B) P1AP=BP1g(A)P=g(B)
  3. A为准对角矩阵 ⇒ \Rightarrow g(A)也是准对角矩阵且
    A = [ A 1 A 2 ⋯ A k ] , A i 为 方 子 块 ⇒ g ( A ) = [ g ( A 1 ) g ( A 2 ) ⋯ g ( A k ) ] A = \begin{bmatrix} A_1 & & & \\ & A_2 & & \\ & & \cdots & \\ & & & A_k \end{bmatrix},A_i为方子块 \Rightarrow g(A) = \begin{bmatrix} g(A_1) & & & \\ & g(A_2) & & \\ & & \cdots & \\ & & & g(A_k) \end{bmatrix} A=A1A2AkAig(A)=g(A1)g(A2)g(Ak)

方阵g(A)计算
已知方阵A和多项式 g ( λ ) = a m λ m + a m − 1 λ m − 1 + ⋯ + a 1 λ + a 0 g(\lambda) = a_m \lambda^m + a_{m - 1} \lambda ^ {m - 1} + \cdots + a_1 \lambda + a_0 g(λ)=amλm+am1λm1++a1λ+a0
m ≥ r m \geq r mr时,
g ( J ( λ ) ) = ∑ i = 0 r − 1 g ( i ) ( λ ) i ! U i = [ g ( λ ) g ′ ( λ ) ⋯ g ( r − 1 ) ( λ ) ( r − 1 ) ! g ( λ ) ⋱ ⋮ ⋱ g ′ ( λ ) g ( λ ) ] g(J(\lambda)) = \sum^{r - 1}_{i=0}\frac{g^{(i)}(\lambda)}{i!}U^i = \begin{bmatrix} g(\lambda) & g'(\lambda) & \cdots & \frac{g^{(r - 1)(\lambda)}}{(r - 1)!} \\ & g(\lambda) & \ddots & \vdots \\ & & \ddots & g'(\lambda) \\ & & & g(\lambda) \end{bmatrix} g(J(λ))=i=0r1i!g(i)(λ)Ui=g(λ)g(λ)g(λ)(r1)!g(r1)(λ)g(λ)g(λ)
m < r m < r m<r时,
g ( J ( λ ) ) = [ g ( λ ) g ′ ( λ ) ⋯ g m ( λ ) m ! 0 ⋯ 0 g ( λ ) ⋱ 0 ⋱ g ( m ) ( λ ) m ! ⋱ ⋮ g ′ ( λ ) g ( λ ) ] g(J(\lambda)) = \begin{bmatrix} g(\lambda) & g'(\lambda) & \cdots & \frac{g^m(\lambda)}{m!} & 0 & \cdots & 0 \\ & g(\lambda) & & & \ddots & & 0 \\ & & & \ddots & & & \frac{g^{(m)}(\lambda)}{m!} \\ & & & \ddots & & &\vdots \\ & & & & & & g'(\lambda) \\ & & & & & & g(\lambda) \end{bmatrix} g(J(λ))=g(λ)g(λ)g(λ)m!gm(λ)000m!g(m)(λ)g(λ)g(λ)

其中r表示 J ( λ ) J(\lambda) J(λ)的阶数

3.2 方阵的化零多项式

化零多项式: n阶方阵A, ∃ 多 项 式 g ( λ ) , 使 g ( A ) = 0 \exists 多项式g(\lambda),使g(A) = 0 g(λ)使g(A)=0
Cayley-Hamilton: f ( λ ) = ∣ λ I − A ∣ = λ n + a n − 1 λ n − 1 + ⋯ + a 1 λ + a 0 ⇒ f ( A ) = 0 f(\lambda) = |\lambda I - A| = \lambda^n + a_{n - 1} \lambda^{n - 1} + \cdots + a_1 \lambda + a_0 \Rightarrow f(A) = 0 f(λ)=λIA=λn+an1λn1++a1λ+a0f(A)=0,即方阵A的特征多项式就是A的化零多项式

f ( λ ) f(\lambda) f(λ)为n次多项式, f ( A ) = 0 f(A) = 0 f(A)=0使得 A n A^n An可以表示为 A k ( k < n ) A^k(k < n) Ak(k<n)的幂次项的组合:
A n = − ( a n − 1 A n − 1 + a n − 2 A n − 2 + ⋯ + a 1 A + a 0 I ) A^n = -(a_{n - 1}A^{n - 1} + a_{n - 2}A^{n - 2} + \cdots + a_1A + a_0I) An=(an1An1+an2An2++a1A+a0I)

例题

例题一
在这里插入图片描述
例题二
A = [ 1 0 1 − 1 ] , f ( λ ) = ∣ λ I − A ∣ = λ 2 − 1 , g ( λ ) = λ 6 + 2 λ 5 − 4 λ 3 + λ 2 − 5 A = \begin{bmatrix} 1 & 0 \\ 1 & -1 \end{bmatrix},f(\lambda) = |\lambda I - A| = \lambda^2 - 1,g(\lambda) = \lambda^6 + 2 \lambda^5 -4 \lambda^3 + \lambda^2 - 5 A=[1101]f(λ)=λIA=λ21g(λ)=λ6+2λ54λ3+λ25,求g(A)
解: g ( λ ) = ( λ 2 − 1 ) ( λ 4 + 2 λ 3 + λ 2 − 2 λ + 2 ) + ( − 2 λ − 3 ) ⇒ g ( A ) = − 2 A − 3 g(\lambda) = (\lambda^2 - 1)(\lambda^4 + 2 \lambda^3 + \lambda^2 - 2 \lambda + 2) + (-2 \lambda - 3) \Rightarrow g(A) = -2 A - 3 g(λ)=(λ21)(λ4+2λ3+λ22λ+2)+(2λ3)g(A)=2A3

3.3 最小多项式

概念

A ∈ C n × n A \in C^{n \times n} ACn×n,则A有无数个化零多项式。事实上, f ( λ ) = ∣ λ I − A ∣ , 有 f ( A ) = 0 f(\lambda) = |\lambda I - A|,有f(A) = 0 f(λ)=λIAf(A)=0
∀ g ( λ ) = h ( λ )   f ( λ ) \forall g(\lambda) = h(\lambda) \ f(\lambda) g(λ)=h(λ) f(λ),均有 g ( A ) = h ( A ) ⋅ f ( A ) g(A) = h(A) \cdot f(A) g(A)=h(A)f(A)

最小多项式: n阶方阵A的所有化零多项式中,次数最低且首系数为1的多项式称为A的最小多项式,记为 m ( λ ) m(\lambda) m(λ)

性质

T的特征多项式 f ( λ ) f(\lambda) f(λ)与最小多项式 m ( λ ) m(\lambda) m(λ)有相同的根(重数不计),即
f ( λ ) = ∣ λ I − A ∣ = ( λ − λ 1 ) r 1 ( λ − λ 2 ) r 2 ⋯ ( λ − λ s ) r s f(\lambda) = |\lambda I - A| = (\lambda - \lambda_1)^{r_1}(\lambda - \lambda_2)^{r_2} \cdots (\lambda - \lambda_s)^{r_s} f(λ)=λIA=(λλ1)r1(λλ2)r2(λλs)rs

⇒ \Rightarrow m ( λ ) = ( λ − λ 1 ) t 1 ( λ − λ 2 ) t 2 ⋯ ( λ − λ s ) t s , 1 ≤ t i ≤ r i , i = 1 ,   2 ,   ⋯   ,   s m(\lambda) = (\lambda - \lambda_1)^{t_1}(\lambda - \lambda_2)^{t_2} \cdots (\lambda - \lambda_s)^{t_s},1 \leq t_i \leq r_i,i = 1,\ 2,\ \cdots,\ s m(λ)=(λλ1)t1(λλ2)t2(λλs)ts1tirii=1, 2, , s

设T的特征多项式为
f ( λ ) = ( λ − λ 1 ) r 1 ( λ − λ 2 ) r 2 ⋯ ( λ − λ s ) r s , f(\lambda) = (\lambda - \lambda_1)^{r_1}(\lambda - \lambda_2)^{r_2} \cdots (\lambda - \lambda_s)^{r_s}, f(λ)=(λλ1)r1(λλ2)r2(λλs)rs

T的Jordan标准形中关于特征值 λ i \lambda_i λi的Jordan块的最高阶数为 n i ‾ \overline{n_i} ni,则T的最小多项式 m ( λ ) = ( λ − λ 1 ) n 1 ‾ ( λ − λ 2 ) n 2 ‾ ⋯ ( λ − λ s ) n s ‾ m(\lambda) = (\lambda - \lambda_1)^{\overline{n_1}}(\lambda - \lambda_2)^{\overline{n_2}} \cdots (\lambda - \lambda_s)^{\overline{n_s}} m(λ)=(λλ1)n1(λλ2)n2(λλs)ns


线性变换T可对角化    ⟺    \iff T有n个线性无关的特征向量    ⟺    \iff m ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ s ) m(\lambda) = (\lambda - \lambda_1)(\lambda - \lambda_2) \cdots (\lambda - \lambda_s) m(λ)=(λλ1)(λλ2)(λλs)


A ∈ C n × n A \in C ^ {n \times n} ACn×n,A的最小多项式 m ( λ ) m(\lambda) m(λ),特征多项式 f ( λ ) f(\lambda) f(λ),任一化零多项式 ψ ( λ ) \psi (\lambda) ψ(λ),则

  1. m ( λ ) ∣ ψ ( λ ) , 即 ψ ( λ ) = h ( λ ) ⋅ m ( λ ) m(\lambda) | \psi (\lambda),即\psi (\lambda) = h(\lambda) \cdot m(\lambda) m(λ)ψ(λ)ψ(λ)=h(λ)m(λ) m ( λ ) m(\lambda) m(λ)整除T的一切化零多项式
  2. m ( λ ) m(\lambda) m(λ)的零点是A的特征值,反之,A的特征值是 m ( λ ) m(\lambda) m(λ)的零点
  3. m ( λ ) m(\lambda) m(λ)是唯一的

相似矩阵具有相同的最小多项式
∧ = [ λ 1 λ 2 ⋱ λ s ] \wedge = \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_s \end{bmatrix} =λ1λ2λs,若 λ 1 ,   ⋯   ,   λ s \lambda1,\ \cdots,\ \lambda_s λ1, , λs互异,则 m ( λ ) = ( λ − λ 1 ) ⋯ ( λ − λ s ) m(\lambda) = (\lambda - \lambda_1) \cdots (\lambda - \lambda_s) m(λ)=(λλ1)(λλs)

本博客中所有内容均来自《矩阵论》第二版 华科,加入了一些自己的理解和简化,如有侵权,请联系删除

  • 55
    点赞
  • 302
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值