线性代数(六) 线性变换

前言

线性空间》定义了空间,这章节来研究空间与空间的关联性

函数

函数是一个规则或映射,将一个集合中的每个元素(称为自变量)映射到另一个集合中的唯一元素(称为因变量)。
在这里插入图片描述
一般函数从 “A” 的每个元素指向 “B” 的一个函数
它不会有一个 “A” 的元素指向多于一个 “B” 的元素,所以一对多在函数是不允许的(“f(x) = 7 或 9” 是不允许的)
但多于一个 “A” 的元素可以指向同一个 “B” 的元素(多对一是允许的)

  • 单射的意思是 “A” 的每个元素都有 它独有的在 “B” 的相对元素。单射也称为 “一对一”。但可以有些 “B” 的元素没有相对的 “A” 的元素。单射存在可逆函数,使得B对A单射
  • 满射,每个(所有) “B” 的元素都有至少一个相对的 “A” 的元素(可能多于一个)。
  • 双射,单射和满射都成立。

线性空间的同构

在这里插入图片描述

  • 同构映射具有反身性、对称性与传递性。
  • 内积空间同构,还需要满足内积不变, ∀ α , β ∈ V , 有 ( σ ( α ) , σ ( β ) ) = ( α , β ) \forall \alpha,\beta \in V, 有(\sigma(\alpha),\sigma(\beta)) = (\alpha, \beta) α,βV,(σ(α),σ(β))=(α,β)

使用单射,满射满足性线空间性质的称为同态(了解下)

线性变换

把上述同构定义中的 V ′ V' V换成 V V V,即 V V V空间通过双射函数 V V V空间的映射。称为“自同构”。如果是“单射”或者“满射”函数映射,则称为“自同态”。也称叫“线性变换”。

线性变换(linear transformation)是线性空间V到其自身的线性映射

线性变换的矩阵

在这里插入图片描述
从公式可得,因为最终值是不变的,如果基组选取不同,A矩阵会变动

线性变换不同基下的矩阵

由上面的关系式可以看出,若选定不同的基,则同一个线性变换在不同基下面的矩阵是不同的,但是这两个矩阵之间存在着一种特殊的关系
在这里插入图片描述
矩阵 A A A和矩阵 B B B 之间的这种关系为相似关系,即同一个线性变换在不同基下的矩阵是相似的。即有相似矩阵的性质

矩阵的相似对角化

上面讲述了线性变换在不同基下的矩阵之间的关系,知道了线性变换在不同基下的矩阵是相似的。进而我们可以通过选取不同的基,使得线性变换在这组基下的矩阵的形式最简单,由于对角矩阵具有良好的性质,因此我们希望通过选取合适的基,使得线性变换在这组基下的矩阵是对角矩阵。怎么找到对角矩阵 Λ \Lambda Λ
Λ = P − 1 A P \Lambda = P^{-1}AP Λ=P1AP
A是已知 φ \varphi φ,问题等价于寻找一个可逆矩阵P

在这里插入图片描述
反过来,若 A A A是可相似对角化,那么 A A A是否有n个线性无关的特征向量呢?
在这里插入图片描述
综上,矩阵 A A A可相似对角化的充分必要条件是矩阵 A A A有n个线性无关的特征向量

在这里插入图片描述

求相似对角化矩阵
  1. 已知: Λ = P − 1 A P , { ε } P = { η } \Lambda = P^{-1}AP, \{\varepsilon\}P = \{\eta\} Λ=P1AP,{ε}P={η}, P是过渡矩阵
  2. 假设 { ε } \{\varepsilon\} {ε}是欧式空间的标准正交基组,已矩阵A
  3. 验证充分必要条件:矩阵 A A A有n个线性无关的特征向量
  4. 将n个线性无关的特征向量,组建新的基组{ β \beta β}
  5. 为了更方便的计算,我们将基组{ β \beta β},施密特正交化,求出标准正交基本组{ η \eta η}
  6. 根据 { ε } P = { η } \{\varepsilon\}P = \{\eta\} {ε}P={η} P = { η } P=\{\eta\} P={η}
  7. 代入公式 Λ = P − 1 A P \Lambda = P^{-1}AP Λ=P1AP,得对角矩阵 Λ \Lambda Λ

具体计算过程:实对称矩阵的对角化

对于n维线性空间V上的线性变换A,如果能够找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是对角矩阵,那么称A是可对角化。但是如果A不能对角化呢?我们便退而求其次,找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是分块对角矩阵

不变子空间

在这里插入图片描述
A \Alpha A是线性变换

  • Im ⁡ A \operatorname{Im} A ImA 是指线性变换 A 的值域(Image),也被称为像空间或范围。它表示所有通过该线性变换 A 映射到的向量的集合。
  • Ker ⁡ A \operatorname{Ker} A KerA是指线性变换A的核空间(Kernel),也被称为零空间(Null Space)。它表示所有在该线性变换下映射到零向量的向量的集合。
  • A的特征子空间(Eigenspace)是指在线性变换A下与给定特征值 λ {\lambda} λ相对应的所有特征向量构成的子空间 V λ {V_\lambda} Vλ
一些重要不变子空间
  1. Im ⁡ A \operatorname{Im} A ImA或V空间本身

    • 任取 a ∈ V , A a ∈ V a \in V, Aa \in V aV,AaV
    • A a ∈ Im ⁡ A , A ( A a ) ∈ Im ⁡ A Aa \in \operatorname{Im} A, A(Aa) \in \operatorname{Im} A AaImA,A(Aa)ImA
  2. Ker ⁡ A \operatorname{Ker} A KerA或0空间

  3. A的特征子空间

    假设V在A线性变化下,有一特征值为 λ {\lambda} λ,对应特征向量组成的空间为A的特征子空间,记 V λ {V_\lambda} Vλ.

    • 任取 a ∈ V λ , A a = λ a ∈ V λ a \in V_{\lambda},Aa=\lambda a \in V_{\lambda} aVλ,Aa=λaVλ
  4. 设B也是V上的线性变换,如果A和B可交换,那么 Im ⁡ B , Ker ⁡ B , B \operatorname{Im} B,\operatorname{Ker} B,B ImB,KerB,B的特征子空间 是A-子空间在这里插入图片描述

  5. V上的线性变换A的不变子空间的和与交仍是A的不变子空间.

    • a ∈ A 1 − , b ∈ A 2 − , a + b ∈ A 1 − ⊕ A 2 − a \in A_1-, b \in A_2-, a+b \in A_1- \oplus A_2- aA1,bA2,a+bA1A2
    • A ( a + b ) = A a + A b ∈ A − ⊕ B − A(a+b) = Aa + Ab \in A- \oplus B- A(a+b)=Aa+AbAB
  6. 在这里插入图片描述

线性变换在不变子空间上的限制

在这里插入图片描述

不变子空间与线性变换的矩阵化简

在这里插入图片描述
把基本不变子空间W分成 ( ε w , ε o t h r e r ) (\varepsilon_w,\varepsilon_{othrer}) (εw,εothrer),又因为 A 1 A_1 A1是W的线性变化,在 ε w \varepsilon_w εw下必是 ε w A 1 \varepsilon_wA_1 εwA1.即当仅仅当矩阵满足以下形状
( A 1 A 2 0 A 3 ) \begin{pmatrix} A_1 & A_2\\ 0 & A_{3} \end{pmatrix} (A10A2A3)
才能满足需求。

在这里插入图片描述
即:V的线性变换A可分块对角矩阵化的充要条件是 V可分解为A的不变子空间的直和

Hamilton-Cayley定理与值和分解

在这里插入图片描述
即将特征多项式
f ( λ ) = | λ I − A ∣ f(\lambda)=|\lambda I-A| f(λ)=λIA
再根据多项式因式分解
f ( λ ) = f 1 ( λ ) f 2 ( λ ) . . . f n ( λ ) = 0 f(\lambda)=f_1(\lambda)f_2(\lambda)...f_n(\lambda) = 0 f(λ)=f1(λ)f2(λ)...fn(λ)=0
其中 f 1 ( λ ) f 2 ( λ ) . . . f n ( λ ) f_1(\lambda)f_2(\lambda)...f_n(\lambda) f1(λ)f2(λ)...fn(λ)互为素数
V = Ker ⁡ f ( λ ) = Ker ⁡ f 1 ( λ ) ⨁ Ker ⁡ f 2 ( λ ) ⨁ . . . ⨁ Ker ⁡ f n ( λ ) V=\operatorname{Ker}f(\lambda)=\operatorname{Ker}f_1(\lambda) \bigoplus \operatorname{Ker}f_2(\lambda)\bigoplus...\bigoplus\operatorname{Ker}f_n(\lambda) V=Kerf(λ)=Kerf1(λ)Kerf2(λ)...Kerfn(λ)
f ( λ ) f(\lambda) f(λ)进一步分解
f ( λ ) = ( λ − λ 1 ) r 1 ( λ − λ 2 ) r 2 . . . ( λ − λ n ) r n f(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}...(\lambda-\lambda_n)^{r_n} f(λ)=(λλ1)r1(λλ2)r2...(λλn)rn
再线性变换A代入得
V = Ker ⁡ ( ( A − λ 1 I ) r 1 ) ⨁ Ker ⁡ ( ( A − λ 2 I ) r 2 ) ⨁ . . . ⨁ Ker ⁡ ( ( A − λ n I ) r n ) V=\operatorname{Ker}((A-\lambda_1 I)^{r_1}) \bigoplus \operatorname{Ker}((A-\lambda_2I)^{r_2})\bigoplus...\bigoplus\operatorname{Ker}((A-\lambda_n I)^{r_n}) V=Ker((Aλ1I)r1)Ker((Aλ2I)r2)...Ker((AλnI)rn)

其中 Ker ⁡ ( ( A − λ n I ) r n ) , n = 1 , 2... s \operatorname{Ker}((A-\lambda_n I)^{r_n}), n=1,2...s Ker((AλnI)rn),n=1,2...s,称为根子空间

对角矩阵中的每个分块矩阵,对应着不同特征值 λ \lambda λ对应的空间

幂零变换

σ为空间V的线性变换,若存在自然数 m,使得 σ m = 0 σ^m=0 σm=0,则称σ为幂零变换,最小的m称为幂零次数。

循环子空间和强循子环空间的定义

在这里插入图片描述
不难分析得到循环子空间和强循环子空间均为 A A A的一个不变子空间。
在这里插入图片描述

约当块(Jordan Block)

在这里插入图片描述

可以根据下文介绍的 λ \lambda λ矩阵证明其多项式: ( λ − k ) l (\lambda-k)^l (λk)l

λ矩阵

所谓 λ \lambda λ矩阵,实际上我们并不陌生,在学习线性变换的特征值与特征向量时,我们引入了线性变换的特征矩阵 λ E − A \lambda E-A λEA , 其中 A A A是数域 P P P上的n维线性空间 V V V中的线性变换 A A A 在某一组基 ε 1 , ε 2 , . . . ε 3 \varepsilon_1,\varepsilon_2,...\varepsilon_3 ε1,ε2,...ε3下的矩阵,这个特征矩阵 λ E − A \lambda E-A λEA 就是一个 λ \lambda λ矩阵.

在这里插入图片描述
在我们学习数字矩阵时,矩阵当中的每一个位置都放置一个数字元素,而如果将数字矩阵当中的数字全部替换成数域 P P P上的一元多项式环 P [ λ ] P[\lambda] P[λ]中的一元多项式 f ( λ ) f(\lambda) f(λ),那么对应得到的新的矩阵就称之为 λ \lambda λ矩阵.

关于一元多项式环,请参考《补充P4关于环的知识

  • 由于一元多项式环 P [ λ ] P[\lambda] P[λ]中的多项式之间的运算——加法、减法、乘法与数字之间的加、减、乘遵循同样的运算规律,因此,对于 λ \lambda λ矩阵我们可以类似的定义 λ \lambda λ矩阵之间的加法、数乘以及乘法,这些运算与数字矩阵具有完全相同的运算规律。、
  • 以定义 n × n n × n n×n λ \lambda λ矩阵.所对应的行列式,它与数字矩阵的行列式具有完全相同的性质. 矩阵乘积的行列式等于行列式的乘积,这一结论同样是成立的
  • λ \lambda λ矩阵.的子式的概念,其与数字矩阵的子式的概念也是完全类似的在这里插入图片描述
  • λ \lambda λ矩阵可逆的定义与数字矩阵中的可逆的矩阵的定义是类似的在这里插入图片描述
  • λ \lambda λ矩阵可逆条件是 ∣ A ( λ ) ∣ = d |A(\lambda)|=d A(λ)=d在这里插入图片描述
λ \lambda λ矩阵的初等行列变换
  1. 互换矩阵中任意两行(列)的位置;
  2. 将矩阵中的任意一行(列)乘以一个非零常数;
  3. 将矩阵的任意一行(列)乘以任意 φ ( λ ) \varphi(\lambda) φ(λ)后加到另外一行(列)上。

在这里插入图片描述
在数字矩阵中,如果两个数字矩阵 A A A B B B 可以经过初等变换互化,那么我们称这两个矩阵是等价的,同样的我们也可以定义 λ \lambda λ矩阵的等价的概念。
在这里插入图片描述

标准型

λ \lambda λ矩阵在进行初等变换后能够将矩阵化简成简单标准的模型。
在这里插入图片描述
在这里插入图片描述
有了上面的引理,我们就可以得到下面的重要定理。
在这里插入图片描述

  • 对于正整数 k k k 1 ≤ k ≤ r 1\leq k \leq r 1kr A ( λ ) A(\lambda) A(λ)中必有非零的 k k k级子式, A ( λ ) A(\lambda) A(λ) 中全部 k k k级子式的首项系数为1的最大公因式 D k ( λ ) D_k(\lambda) Dk(λ)称为 A ( λ ) A(\lambda) A(λ) k k k行列式因子
  • 等价的 λ \lambda λ矩阵具有相同的秩与相同的各级行列式因子

这种最简单的矩阵称为 A ( λ ) A(\lambda) A(λ)的标准形,且是唯一的。
在这里插入图片描述
在这里插入图片描述

两个 λ \lambda λ矩阵等价的充要条件是它们有相同的行列式因子,或者它们有相同的不变因子

初等因子

初等因子,就是组成不变因子的“砖块”:如果不变因子 d k ( λ ) = ( λ − 1 ) 2 ( λ − 1 ) d_k(\lambda)=(\lambda-1)^2(\lambda-1) dk(λ)=(λ1)2(λ1) ,对应的初等因子就是 ( λ − 1 ) 2 、 ( λ − 1 ) (\lambda-1)^2、(\lambda-1) (λ1)2(λ1).
在这里插入图片描述

标准型的可逆条件

在这里插入图片描述
同样相似矩阵的性质也适用 λ \lambda λ矩阵:

  • A A A B B B 相似的充要条件是它们的特征矩阵 λ E − A \lambda E-A λEA λ E − B \lambda E-B λEB等价。
  • 相似 A A A B B B    ⟺    \iff 有相同的不变因子    ⟺    \iff 有相同的初等因子

若尔当(Jordan)标准形

Jordan标准形即分块对角阵
在这里插入图片描述
矩阵的若尔当标准形是为了解决那些不可相似对角化的矩阵的化简问题,我们知道,如果一个矩阵可以进行相似对角化,那么这个矩阵的一些运算就可以被极大的简化,由于相似矩阵之间具有很多的相似不变量:特征多项式、特征值、矩阵的行列式、矩阵的迹、最小多项式、不变因子、行列式因子、初等因子。因此如果一个矩阵能够相似一个形式简单的矩阵,那么在求上述相似不变量时就可以很容易的得到。
在这里插入图片描述

  1. 诺尔当块 J 0 J_0 J0的初等因子只有 ( λ − λ 0 ) n (\lambda-\lambda_0)^n (λλ0)n(其中的 λ 0 \lambda_0 λ0就是对角线上的元素)在这里插入图片描述
  2. 诺尔当块 J 1 , J 2 , . . . J x J_1,J_2,...J_x J1,J2,...Jx的初等因子分别为 ( λ − λ 1 ) k 1 , ( λ − λ 2 ) k 2 , . . . , ( λ − λ s ) k s (\lambda-\lambda_1)^{k_1},(\lambda-\lambda_2)^{k_2},...,(\lambda-\lambda_s)^{k_s} (λλ1)k1,(λλ2)k2,...,(λλs)ks,它们组合起来的诺尔当型 J J J的初等因子,即是每个块的对角线元素 λ 0 \lambda_0 λ0与阶数 k i k_i ki的组合在这里插入图片描述

于是,每个拥相同的初等因子的矩阵就都相似于 J J J,对于任意的矩阵 A A A ,它的特征矩阵 λ E − A \lambda E-A λEA ,得到其初等因子为 ( λ − λ 1 ) k 1 , ( λ − λ 2 ) k 2 , . . . , ( λ − λ s ) k s (\lambda-\lambda_1)^{k_1},(\lambda-\lambda_2)^{k_2},...,(\lambda-\lambda_s)^{k_s} (λλ1)k1,(λλ2)k2,...,(λλs)ks.

在这里插入图片描述

其它证明

更多参考:【矩阵论】Jordan 标准型及其求解方法

  • 证明 B B B是域F上r维线性空间 W W W上的一个幂零变换,其幂零指数为 l l l,可以分解成 d i m W 0 个子循环子空间的直和, W 0 dim W_0个子循环子空间的直和,W_0 dimW0个子循环子空间的直和,W0是B中特征值为0的子空间。当 l = r l=r l=r时, W 0 = W W_0=W W0=W.

r > l 时, r>l时, r>l时,证明过程《幂零变化Jordan标准形

欧式空间中的变换

欧式空间中的几类变换我们可以利用他们的特性更快的进行求解相似标准型。

正交变换

在这里插入图片描述

正交变换的性质如下

在这里插入图片描述

性质6,如果证明出 α ≠ β \alpha \not = \beta α=β就说明不是单射

对称变换

设A是实内积空间 V V V的变换,如果 A A A满足
( A α , β ) = ( α , A β ) , ∀ α , β ∈ V (A\alpha,\beta)=(\alpha,A\beta),\forall \alpha,\beta \in V (Aα,β)=(α,Aβ),α,βV
那么称 A A A为V空间的一个对称变换。
在这里插入图片描述

对称矩阵的性质

在这里插入图片描述

正交对角化过程参考:对称矩阵的正交对角化对称变换

  1. 对称变换中先求正交基,然后再代入公式求对角化矩阵
  2. 对称矩阵的正交对角化直接利用相似标准型特征值相同来猜出对角证,然后再验证

正规变换

除了上述的线性变换,我们还其它的常见的线性变换

  • 在实数域的欧式空间上:
    • 正交变换:在一组标准正交基下的矩阵为正交矩阵 A T A = E A^TA=E ATA=E
    • 对称变换:在一组标准正交基下的矩阵为对称矩阵 A T = A A^T=A AT=A
  • 推广至复数域的酉空间上:
    • 酉变换:在一组标准正交基下的矩阵为酉矩阵 A H A = E A^HA=E AHA=E
    • 共轭变换:在一组标准正交基下的矩阵为Hermite矩阵 A H = A A^H=A AH=A

A H A^H AH称为共轭转置

我们将上述具有良好性质的一类变换叫作正规变换。在一组标准正交基下的矩阵为正规矩阵,满足
A H A = A A H , A 与 A H 都是正规矩阵 A^HA=AA^H,A与A^H都是正规矩阵 AHA=AAHAAH都是正规矩阵

  • 特征向量 A x = λ x ⇒ A H x = λ ˉ x Ax=\lambda x \quad\rArr \quad A^Hx=\=\lambda x Ax=λxAHx=λˉx
  • 正规矩阵 A A A是单纯矩阵(可相似对角化),并且与对角阵酉相似 A = U Λ U H A=U\Lambda U^H A=UΛUH
  • 正规变换/正规矩阵 属于不同特征值的特征子空间(特征向量)互相正交

主要参考

单射、满射和双射
高等代数】线性空间的同构
线性同构与欧氏空间同构
什么是矩阵对角化
浅谈线性变换和矩阵之间的关系
浅谈矩阵的相似对角化(一)
线性代数(实对称矩阵的对角化)
不变子空间
《【高等代数(丘维声著)笔记】6.8线性变换的不变子空间
补充P4关于环的知识
矩阵的初等变换
浅谈λ—矩阵与矩阵的若尔当标准形
laji高代题纲——λ-矩阵
6.10 幂零变换的Jordan标准形
约当块(Jordan Block)与最小多项式
8.3 正交变换
3.3酉变换、正交变换
对称矩阵及重要性质
对称矩阵的正交对角化
8.4 对称变换

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值