1 线性变换与矩阵
1.1 线性变换及其运算
-
定义
设 V V V 是数域 K K K 上的线性空间, T T T 是 V V V 到自身的一个映射,使得对于 V V V 中的任意元素 x \boldsymbol{x} x 均存在唯一的 y ∈ V \boldsymbol{y} \in V y∈V 与之对应,则称 T T T 为 V V V 的一个变换或算子,记为:
T ( x ) = y (1-1) T(\boldsymbol{x}) = \boldsymbol{y} \tag{1-1} T(x)=y(1-1)
称 y \boldsymbol{y} y 为 x \boldsymbol{x} x 在变换 T T T 下的象, x \boldsymbol{x} x 为 y \boldsymbol{y} y 的原象(或象源)。
如果数域 K K K 上的线性空间 V V V 的一个变换 T T T 具有下列性质(齐次可加性):对任意 x , y ∈ V , k , l ∈ K \boldsymbol{x, y} \in V,k, l \in K x,y∈V,k,l∈K,都有, T ( k x + l y ) = k T ( x ) + l T ( y ) (1-2) T(k\boldsymbol{x} + l\boldsymbol{y}) = kT(\boldsymbol{x}) + lT(\boldsymbol{y}) \tag{1-2} T(kx+ly)=kT(x)+lT(y)(1-2)
则称 T T T 为 V V V 的一个线性变换或线性算子。 -
性质
(1)线性变换把零元素仍变为零元素
(2)负元素的象为原来元素的象的负元素
(3)线性变换把线性相关的元素组仍变为线性相关的元素组
注: 线性无关的元素组经过线性变换不一定再是线性无关的, 变换后的情况与元素组和线性变换有关。若线性变换 T T T 将所有的元素组仍变换为线性无关的元素组,则称之为满秩的线性变换,其变换矩阵为满秩矩阵。 -
线性变换的运算
(1) 恒等变换(单位变换) T e : ∀ x ∈ V , T e x = x T_e: \forall \boldsymbol{x} \in V, T_e\boldsymbol{x} = \boldsymbol{x} Te:∀x∈V,Tex=x
(2) 零变换 T 0 : ∀ x ∈ V , T 0 x = 0 T_0:\forall \boldsymbol{x} \in V, T_0\boldsymbol{x} = 0 T0:∀x∈V,T0x=0
(3) 变换的相等: T 1 、 T 2 T_1、T_2 T1、T2 是 V V V 的两个线性变换, ∀ x ∈ V \forall \boldsymbol{x} \in V ∀x∈V,均有 T 1 x = T 2 x T_1\boldsymbol{x} = T_2\boldsymbol{x} T1x=T2x,则称 T 1 = T 2 T_1 = T_2 T1=T2
(4) 线性变换的和 T 1 + T 2 : ∀ x ∈ V , ( T 1 + T 2 ) x = T 1 x + T 2 x T_1 + T_2:\forall \boldsymbol{x} \in V,(T_1+T_2)\boldsymbol{x} = T_1\boldsymbol{x} +T_2\boldsymbol{x} T1+T2:∀x∈V,(T1+T2)x=T1x+T2x
(5) 线性变换的数乘 k T : ∀ x ∈ V , ( k T ) x = k ( T x ) kT:\forall \boldsymbol{x} \in V,(kT)\boldsymbol{x} = k(T\boldsymbol{x}) kT:∀x∈V,(kT)x=k(Tx)
负变换: ( − T ) x = − ( T x ) (-T)\boldsymbol{x} = -(T\boldsymbol{x}) (−T)x=−(Tx)
(6) 线性变换的乘积 T 1 T 2 : ∀ x ∈ V , ( T 1 T 2 ) x = T 1 ( T 2 x ) T_1T_2:\forall \boldsymbol{x} \in V,(T_1T_2)\boldsymbol{x} = T_1(T_2\boldsymbol{x}) T1T2:∀x∈V,(T1T2)x=T1(T2x)
(7) 逆变换 T − 1 : ∀ x ∈ V T^{-1}:\forall \boldsymbol{x} \in V T−1:∀x∈V,若存在线性变换 S S S 使得 ( S T ) x = ( T S ) x = x (ST)\boldsymbol{x} = (TS)\boldsymbol{x} = \boldsymbol{x} (ST)x=(TS)x=x,则称 S S S 为 T T T 的逆变换,即 S = T − 1 S = T^{-1} S=T−1
(8)线性变换的多项式:
T n = T T ⋯ T ⏟ n ,并规定 T 0 = T e f ( t ) = ∑ n = 0 N a n T n → f ( T ) x = ∑ n = 0 N a n T n x (1-3) T^n = \underbrace{TT \cdots T}_{n},并规定 T^0 = T_e \\ f(t) = \sum_{n=0}^{N}a_nT^n \to f(T)\boldsymbol{x} = \sum_{n=0}^{N}a_nT^n\boldsymbol{x} \tag{1-3} Tn=n TT⋯T,并规定T0=Tef(t)=n=0∑NanTn→f(T)x=n=0∑NanTnx(1-3)
注: 和矩阵的乘积一样,线性变换的乘积不满足交换律;不是所有的变换都具有逆变换,只有满秩变换才有逆变换, S T = T e ST = T_e ST=Te。
1.2 线性变换的矩阵表示
1. 推导
设
T
T
T 是线性空间
V
n
V_n
Vn 的线性变换,
x
∈
V
n
\boldsymbol{x} \in V_n
x∈Vn,且
x
1
,
x
2
,
⋯
,
x
n
\boldsymbol{x_1, x_2, \cdots, x_n}
x1,x2,⋯,xn 是
V
n
V_n
Vn的一个基,则有:
x
=
a
1
x
1
+
a
2
x
2
+
⋯
+
a
n
x
n
T
x
=
a
1
(
T
x
1
)
+
a
2
(
T
x
2
)
+
⋯
+
a
n
(
T
x
n
)
(1-4)
\boldsymbol{x} = a_1\boldsymbol{x_1}+a_2\boldsymbol{x_2}+ \cdots +a_n\boldsymbol{x_n} \\ \quad T\boldsymbol{x} = a_1(T\boldsymbol{x_1})+a_2(T\boldsymbol{x_2})+ \cdots +a_n(T\boldsymbol{x_n}) \tag{1-4}
x=a1x1+a2x2+⋯+anxnTx=a1(Tx1)+a2(Tx2)+⋯+an(Txn)(1-4)
这表明,
V
n
V^n
Vn 中任一向量
x
\boldsymbol{x}
x 的象由基象组
T
x
1
,
T
x
2
,
⋯
,
T
x
n
T\boldsymbol{x_1},T\boldsymbol{x_2},\cdots,T\boldsymbol{x_n}
Tx1,Tx2,⋯,Txn 唯一确定。因为基象组仍属于
V
n
V_n
Vn,故可令
{
T
x
1
=
a
11
x
1
+
a
21
x
2
+
⋯
+
a
n
1
x
n
,
T
x
2
=
a
12
x
1
+
a
22
x
2
+
⋯
+
a
n
2
x
n
,
⋯
⋯
T
x
n
=
a
1
n
x
1
+
a
2
n
x
2
+
⋯
+
a
n
n
x
n
,
(1-5)
\begin{cases} T\boldsymbol{x_1} = a_{11}\boldsymbol{x_1} + a_{21}\boldsymbol{x_2} + \cdots + a_{n1}\boldsymbol{x_n},\\ T\boldsymbol{x_2} = a_{12}\boldsymbol{x_1} + a_{22}\boldsymbol{x_2} + \cdots + a_{n2}\boldsymbol{x_n}, \\ \qquad\qquad\qquad\quad\cdots \cdots \\ T\boldsymbol{x_n} = a_{1n}\boldsymbol{x_1} + a_{2n}\boldsymbol{x_2} + \cdots + a_{nn}\boldsymbol{x_n}, \end{cases} \tag{1-5}
⎩
⎨
⎧Tx1=a11x1+a21x2+⋯+an1xn,Tx2=a12x1+a22x2+⋯+an2xn,⋯⋯Txn=a1nx1+a2nx2+⋯+annxn,(1-5)
即
T
x
i
=
∑
j
=
1
n
a
j
i
x
i
(
i
=
1
,
2
,
⋯
,
n
)
(1-6)
T\boldsymbol{x_i}=\sum_{j=1}^{n}a_{ji}\boldsymbol{x_i} \qquad (i= 1,2,\cdots,n)\tag{1-6}
Txi=j=1∑najixi(i=1,2,⋯,n)(1-6)
采用矩阵乘法的形式,式(1-5)可表示为
T
(
x
1
,
x
2
,
⋯
,
x
n
)
=
d
e
f
(
T
x
1
,
T
x
2
,
⋯
,
T
x
n
)
=
(
x
1
,
x
2
,
⋯
,
x
n
)
A
(1-7)
T(\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n}) \overset{def}{=} (T\boldsymbol{x_1}, T\boldsymbol{x_2}, \cdots, T\boldsymbol{x_n})= (\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n})\boldsymbol{A} \tag{1-7}
T(x1,x2,⋯,xn)=def(Tx1,Tx2,⋯,Txn)=(x1,x2,⋯,xn)A(1-7)
其中
A
=
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋮
a
n
1
a
n
2
⋯
a
n
n
]
(1-8)
\boldsymbol{A} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{bmatrix} \tag{1-8}
A=⎣
⎡a11a21⋮an1a12a22⋮an2⋯⋯⋮⋯a1na2nann⎦
⎤(1-8)
矩阵 A \boldsymbol{A} A 的第 i i i 列恰是 T x i T\boldsymbol{x_i} Txi 的坐标( i = 1 , 2 , ⋯ , n i = 1, 2, \cdots, n i=1,2,⋯,n)。
式(1-7)中的矩阵
A
\boldsymbol{A}
A 称为
T
T
T 在
V
n
V_n
Vn 基
x
1
,
x
2
,
⋯
,
x
n
\boldsymbol{x_1}, \boldsymbol{x_2}, \cdots, \boldsymbol{x_n}
x1,x2,⋯,xn 下的矩阵,简称
A
\boldsymbol{A}
A 为
T
T
T 的矩阵。
注: 对于任意
n
n
n 阶矩阵
A
\boldsymbol{A}
A 存在唯一的一个线性变换
T
T
T。所以线性变换可以用矩阵来表示。
T
0
T_0
T0 的矩阵为
O
\boldsymbol{O}
O,
T
e
T_e
Te 的矩阵为
I
\boldsymbol{I}
I,
T
m
T_m
Tm 的矩阵为
m
I
m\boldsymbol{I}
mI(数量矩阵)。
详细推导,请阅读:线性代数笔记——线性变换及对应矩阵。
2. 定理
-
定理一:设 x 1 , x 2 , ⋯ , x n \boldsymbol{x_1, x_2, \cdots, x_n} x1,x2,⋯,xn 是 V n V^n Vn 的一个基, T 1 、 T 2 T_1、T_2 T1、T2 在该基下的矩阵分别为 A 、 B \boldsymbol{A、B} A、B。则有:
(1) ( T 1 + T 2 ) [ x 1 , x 2 , ⋯ , x n ] = [ x 1 , x 2 , ⋯ , x n ] ( A + B ) (T_1 + T_2)[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](\boldsymbol{A+B}) (T1+T2)[x1,x2,⋯,xn]=[x1,x2,⋯,xn](A+B)
(2) k T [ x 1 , x 2 , ⋯ , x n ] = [ x 1 , x 2 , ⋯ , x n ] ( k A ) kT[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](k\boldsymbol{A}) kT[x1,x2,⋯,xn]=[x1,x2,⋯,xn](kA)
(3) ( T 1 T 2 ) [ x 1 , x 2 , ⋯ , x n ] = [ x 1 , x 2 , ⋯ , x n ] ( A B ) (T_1 T_2)[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}](\boldsymbol{AB}) (T1T2)[x1,x2,⋯,xn]=[x1,x2,⋯,xn](AB)
(4) T − 1 [ x 1 , x 2 , ⋯ , x n ] = [ x 1 , x 2 , ⋯ , x n ] A − 1 T^{-1}[\boldsymbol{x_1, x_2, \cdots, x_n}] = [\boldsymbol{x_1, x_2, \cdots, x_n}]\boldsymbol{A}^{-1} T−1[x1,x2,⋯,xn]=[x1,x2,⋯,xn]A−1 -
定理二:设线性变换 T T T 在 V n V^n Vn 的基 x 1 , x 2 , ⋯ , x n \boldsymbol{x_1, x_2, \cdots, x_n} x1,x2,⋯,xn 下的矩阵 A = ( a i j ) \boldsymbol{A}=(a_{ij}) A=(aij),向量 x \boldsymbol{x} x 在该基下的坐标是 ( ξ 1 , ξ 2 , ⋯ , ξ n ) T (\xi_1, \xi_2, \cdots, \xi_n)^T (ξ1,ξ2,⋯,ξn)T,则 T x T\boldsymbol{x} Tx 在该基下的坐标 ( η 1 , η 2 , ⋯ , η n ) T (\eta_1, \eta_2, \cdots, \eta_n)^T (η1,η2,⋯,ηn)T 满足
( η 1 , η 2 , ⋯ , η n ) T = A ( ξ 1 , ξ 2 , ⋯ , ξ n ) T (1-9) (\eta_1, \eta_2, \cdots, \eta_n)^T = \boldsymbol{A}(\xi_1, \xi_2, \cdots, \xi_n)^T \tag{1-9} (η1,η2,⋯,ηn)T=A(ξ1,ξ2,⋯,ξn)T(1-9) -
定理三: 设 V n V^n Vn 的线性变换 T T T,对于 V n V^n Vn 的两个基 x 1 , x 2 , ⋯ , x n \boldsymbol{x_1, x_2, \cdots, x_n} x1,x2,⋯,xn 和 y 1 , y 2 , ⋯ , y n \boldsymbol{y_1, y_2, \cdots, y_n} y1,y2,⋯,yn 的矩阵依次是 A \boldsymbol{A} A 和 B \boldsymbol{B} B,并且
y 1 , y 2 , ⋯ , y n = x 1 , x 2 , ⋯ , x n C (1-10) \boldsymbol{y_1, y_2, \cdots, y_n} = \boldsymbol{x_1, x_2, \cdots, x_n}\boldsymbol{C} \tag{1-10} y1,y2,⋯,yn=x1,x2,⋯,xnC(1-10)
则可以得到: B = C − 1 A C \boldsymbol{B} = \boldsymbol{C}^{-1}\boldsymbol{AC} B=C−1AC。
矩阵和线性变换之间的关系:矩阵本身描述了一个坐标系,矩阵与矩阵的乘法描述了一个运动(线性变换)。换言之:如果矩阵仅仅自己出现,那么他描述了一个坐标系,如果他和另一个矩阵或向量同时出现,而且做乘法运算,那么它表示运动(线性变换)。
补充: 对线性变换直观的理解可以参考视频:线性代数的本质 - 03 - 矩阵与线性变换 和 线性代数的本质 - 04 - 矩阵乘法与线性变换复合,学习笔记:https://zhuanlan.zhihu.com/p/111123005
2 常用变换及其矩阵
2.1 正交变换与正交矩阵
1. 定义
设
V
V
V 是一个欧式空间,
T
T
T 是
V
V
V 上的一个线性变换,如果对于任何向量
x
,
y
∈
V
\boldsymbol{x}, \boldsymbol{y} \in V
x,y∈V,变换
T
T
T 恒能使下式成立(即不改变向量的內积):
(
T
(
x
)
,
T
(
y
)
)
=
(
x
,
y
)
(2-1)
(T(\boldsymbol{x}), T(\boldsymbol{y})) = (\boldsymbol{x}, \boldsymbol{y}) \tag{2-1}
(T(x),T(y))=(x,y)(2-1)
则称
T
T
T 是
V
V
V 上的正交变换。
2. 性质
-
定理一:设 T T T 是欧式空间 V V V 上的线性变换,下面写出的任一条件都是 T T T 成为正交变换的充要条件:
(1)T 是向量长度保持不变,即:对任何 x ∈ V \boldsymbol{x} \in V x∈V,有
( T ( x ) , T ( x ) ) = ( x , x ) ; (2-2) (T(\boldsymbol{x}), T(\boldsymbol{x})) = (\boldsymbol{x}, \boldsymbol{x});\tag{2-2} (T(x),T(x))=(x,x);(2-2)
(2)任一组标准正交基经 T T T 变换后的象仍是一组标准正交基;
(3) T T T 在任意一组标准正交基下的矩阵 A \boldsymbol{A} A 满足
A T A = A A T = I 或 A − 1 = A T (2-3) \boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^{T}=\boldsymbol{I} \quad 或 \quad \boldsymbol{A}^{-1} = \boldsymbol{A}^{T} \tag{2-3} ATA=AAT=I或A−1=AT(2-3) -
定理二:在欧氏空间中,正交变换在标准正交基下的矩阵是正交矩阵;反过来,如果线性变换 T T T 在标准正交基下的矩阵是正交矩阵,则 T T T 是正交变换。
2.2 对称变换与对称矩阵
1. 定义
设
V
V
V 是一个欧式空间,
T
T
T 是
V
V
V 上的一个线性变换,如果对于任何向量
x
,
y
∈
V
\boldsymbol{x}, \boldsymbol{y} \in V
x,y∈V,变换
T
T
T 恒能使下式成立:
(
T
(
x
)
,
y
)
=
(
x
,
T
(
y
)
)
(2-4)
(T(\boldsymbol{x}), \boldsymbol{y}) = (\boldsymbol{x}, T(\boldsymbol{y}))\tag{2-4}
(T(x),y)=(x,T(y))(2-4)
则称
T
T
T 是
V
V
V 上的一个对称变换。
2. 性质
- 定理一: n n n 维欧氏空间 V V V 的线性变换 T T T 是对称变换的充要条件是: T T T 在标准正交基下的矩阵 A \boldsymbol{A} A 是实对称矩阵,即有 A T = A \boldsymbol{A}^{T} = \boldsymbol{A} AT=A。
2.3 Hermite变换及其矩阵
1. 定义
设
V
V
V 是一个酉空间,
T
T
T 是
V
V
V 上的一个线性变换,如果对于任何向量
x
,
y
∈
V
\boldsymbol{x}, \boldsymbol{y} \in V
x,y∈V,变换
T
T
T 恒能使下式成立(即不改变向量的內积):
(
T
(
x
)
,
y
)
=
(
x
,
T
(
y
)
)
(2-5)
(T(\boldsymbol{x}), \boldsymbol{y}) = (\boldsymbol{x}, T(\boldsymbol{y})) \tag{2-5}
(T(x),y)=(x,T(y))(2-5)
则称
T
T
T 是
V
V
V 上的一个Hermite
变换(厄米特变换)。
2. 性质
- 定理一:
Hermite
变换在酉空间的标准正交基下的矩阵 A \boldsymbol{A} A 是Hermite
矩阵,即 A H = A ( H 表示共轭转置) \boldsymbol{A}^{H} = \boldsymbol{A}(H 表示共轭转置) AH=A(H表示共轭转置)。
3 常见的特殊矩阵
3.1 正交矩阵
1. 定义
如果
n
n
n 阶实方阵
A
\boldsymbol{A}
A 满足
A
T
A
=
A
−
1
A
=
I
\boldsymbol{A}^T\boldsymbol{A}=\boldsymbol{A}^{-1}\boldsymbol{A}=\boldsymbol{I}
ATA=A−1A=I,则称
A
\boldsymbol{A}
A 为正交矩阵,简称正交阵。
2. 性质
- 正交矩阵是非奇异的,且 d e t A = 1 det\boldsymbol{A}=1 detA=1或-1,(行列式等于1的正交矩阵叫正常的,等于-1的叫非正常的)。
- 正交矩阵的逆矩阵仍是正交矩阵。
- 两个正交矩阵的乘积仍为正交矩阵。
- 实数域上方阵 A \boldsymbol{A} A是正交矩阵的充分必要条件是:A的行(或列)向量组为标准正交向量组。
3.2 对称矩阵
1. 定义
如果
n
n
n 阶方阵
A
\boldsymbol{A}
A 满足
A
T
=
A
\boldsymbol{A}^T=\boldsymbol{A}
AT=A,则称
A
\boldsymbol{A}
A 为对称矩阵,简称对称阵。
2. 性质
- 实对称矩阵的特征值都是实数。
- 实对称矩阵的不同特征值所对应的特征向量是正交的。
3.3 酉矩阵
1. 定义
若
n
n
n 阶复矩阵
A
\boldsymbol{A}
A 满足
A
H
A
=
A
A
H
=
I
\boldsymbol{A}^H\boldsymbol{A}=\boldsymbol{A}\boldsymbol{A}^H=\boldsymbol{I}
AHA=AAH=I,则称
A
\boldsymbol{A}
A 是酉矩阵。
2. 性质
- 酉矩阵的逆矩阵也是酉矩阵,两个有矩阵的乘积还是酉矩阵。
3.4 Hermite矩阵
1. 定义
设
A
∈
C
n
×
n
\boldsymbol{A} \in \boldsymbol{C}^{n \times n}
A∈Cn×n,若
A
H
=
A
\boldsymbol{A}^H=\boldsymbol{A}
AH=A,则称
A
\boldsymbol{A}
A 为Hermite
矩阵。若
A
H
=
−
A
\boldsymbol{A}^H=-\boldsymbol{A}
AH=−A,则称
A
\boldsymbol{A}
A 为反Hermite
矩阵。
2. 性质
Hermite
矩阵的特征值都是实数。Hermite
矩阵的不同特征值所对应的特征向量是正交的。
3.5 正规矩阵
设 A ∈ C n × n \boldsymbol{A} \in \boldsymbol{C}^{n \times n} A∈Cn×n,若 A A H = A H A \boldsymbol{A}\boldsymbol{A}^H=\boldsymbol{A}^H\boldsymbol{A} AAH=AHA,则称 A \boldsymbol{A} A 为正规矩阵。
3.6 幂等矩阵
设 A ∈ C n × n \boldsymbol{A} \in \boldsymbol{C}^{n \times n} A∈Cn×n,若 A 2 = A \boldsymbol{A}^2=\boldsymbol{A} A2=A,则称 A \boldsymbol{A} A 为幂等矩阵。
3.7 奇异矩阵
当 ∣ A ∣ = 0 \lvert \boldsymbol{A} \rvert=0 ∣A∣=0时, A \boldsymbol{A} A 称为奇异矩阵,否则称非奇异矩阵。由上面两定理可知: A \boldsymbol{A} A 是可逆矩阵的充分必要条件是 ∣ A ∣ ≠ 0 \lvert \boldsymbol{A} \rvert \not= 0 ∣A∣=0,即可逆矩阵就是非奇异矩阵。
3.8 初等矩阵
初等矩阵是指由单位矩阵经过一次初等变换得到的矩阵。初等变换有三种:(1)交换矩阵中某两行(列)的位置;(2)用一个非零常数 k k k 乘以矩阵的某一行(列);(3)将矩阵的某一行(列)乘以常数 k k k 后加到另一行(列)上去。
3.9 正定矩阵
正定矩阵是一种实对称矩阵。正定二次型
f
(
x
1
,
x
2
,
⋯
,
x
n
)
=
X
T
A
X
f(x_1, x_2, \cdots, x_n)=\boldsymbol{X}^T\boldsymbol{AX}
f(x1,x2,⋯,xn)=XTAX 的矩阵
A
\boldsymbol{A}
A 称为正定矩阵。
(1)广义定义:设
A
\boldsymbol{A}
A 是
n
n
n 阶方阵,如果对任何非零向量
z
\boldsymbol{z}
z,都有
z
T
A
z
>
0
\boldsymbol{z}^T\boldsymbol{Az} >0
zTAz>0,就称
A
\boldsymbol{A}
A 为正定矩阵。
(2)狭义定义:一个
n
n
n 阶的实对称矩阵
A
\boldsymbol{A}
A 是正定的的条件是当且仅当对于所有的非零实系数向量
z
\boldsymbol{z}
z,都有
z
T
A
z
>
0
\boldsymbol{z}^T\boldsymbol{Az} >0
zTAz>0。
4 矩阵的等价
如果矩阵 A \boldsymbol{A} A 经有限次初等变换变成矩阵 B \boldsymbol{B} B,就称矩阵 A \boldsymbol{A} A 与 B \boldsymbol{B} B 等价。等价描述的是一种关系,满足反身性对称性以及传递性。矩阵常见的等价关系有三个,相抵,相似以及合同。相抵是一种比较弱的等价关系;相似关系是比较强的等价关系;合同关系是另一种等价关系。
4.1 矩阵的相抵
1. 定义
设
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B 都是
m
×
n
m \times n
m×n 阶矩阵,如果存在非奇异的
m
m
m 阶方阵
D
\boldsymbol{D}
D 和
n
n
n 阶方阵
C
\boldsymbol{C}
C,使
B
=
D
A
C
(4-1)
\boldsymbol{B}=\boldsymbol{DAC}\tag{4-1}
B=DAC(4-1)
成立,则称矩阵
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B 是相抵的,记为
A
≃
B
\boldsymbol{A} \simeq \boldsymbol{B}
A≃B。
相抵关系在几何上的解释:在两个不同维的线性空间
V
n
V^n
Vn 和
V
m
V^m
Vm 中,同一个线性算子
A
\mathscr{A}
A 在不同基所对应的矩阵
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B 之间的关系。
2. 定理
- 定理一:相抵矩阵具有相同的秩。
4.2 矩阵的相似
1. 定义
如果
A
\boldsymbol{A}
A 与
B
\boldsymbol{B}
B是数域
K
K
K 上的两个
n
n
n 阶方阵,如果存在非奇异的
n
n
n 阶方阵
C
\boldsymbol{C}
C,使得
B
=
C
−
1
A
C
(4-2)
\boldsymbol{B}=\boldsymbol{C}^{-1}\boldsymbol{AC} \tag{4-2}
B=C−1AC(4-2)
成立,则称矩阵
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B 是相似的,记为
A
∼
B
\boldsymbol{A} \sim \boldsymbol{B}
A∼B。
几何解释:同一线性变换在不同基下的矩阵是相似的;反之。如果两个矩阵相似,它们可以看做是同一个线性变换在两个不同基下的矩阵。
2. 定理
- 定理一:相似矩阵具有反身性,对称性与传递性。
- 定理二:相似矩阵有相同的迹。
- 定理三:相似矩阵有相同的特征多项式,特征值,行列式、秩。
- 定理四:相似矩阵有相同的最小多项式。
4.3 矩阵的合同
1. 定义
设
A
\boldsymbol{A}
A 与
B
\boldsymbol{B}
B是两个
n
n
n 阶方阵,如果存在非奇异的
n
n
n 阶方阵
C
\boldsymbol{C}
C,使得
B
=
C
T
A
C
(4-3)
\boldsymbol{B}=\boldsymbol{C}^T\boldsymbol{AC} \tag{4-3}
B=CTAC(4-3)
成立,则称矩阵
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B 是相合(或合同)的。
2. 定理
- 定理一:合同矩阵具有反身性,对称性与传递性。
- 定理二:合同矩阵有相同的秩、正负惯性指数。
- 定理三:与对称矩阵合同的矩阵是对称矩阵.
- 定理四:数域 K K K 上任一对称矩阵都合同于一个对角矩阵。
小结:
总之,相抵、相似、合同反映了两矩阵之间的三种内在联系,这三种关系是既有区别又有联系的,相似与合同只不过是相抵的特殊情况,而且相似与合同只有在
C
T
=
C
−
1
\boldsymbol{C}^{T}=\boldsymbol{C}^{-1}
CT=C−1 时(即
C
\boldsymbol{C}
C为正交阵)才一致。
- A \boldsymbol{A} A 与 B \boldsymbol{B} B 相抵 ⟺ P A Q = B ( P , Q 可逆 ) \Longleftrightarrow \boldsymbol{PAQ} = \boldsymbol{B}(\boldsymbol{P, Q}可逆) ⟺PAQ=B(P,Q可逆):
⟺ A \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} ⟺A 可经由初等变换化为 B \boldsymbol{B} B
⟺ A 与 B \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与\boldsymbol{B} ⟺A与B 同型且同秩
⟺ A 与 B \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A}与 \boldsymbol{B} ⟺A与B 有相同的相抵标准形
- A \boldsymbol{A} A 与 B \boldsymbol{B} B 相似 ⟺ P − 1 A P = B ( P 可逆 ) \Longleftrightarrow \boldsymbol{P}^{-1}\boldsymbol{AP} = \boldsymbol{B}(\boldsymbol{P}可逆) ⟺P−1AP=B(P可逆):
⟺ A 与 B \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与 \boldsymbol{B} ⟺A与B有相同的秩、特征多项式、特征值、行列式
⟺ B \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{B} ⟺B 矩阵可对角化
-
A
\boldsymbol{A}
A 与
B
\boldsymbol{B}
B 合同
⟺
P
T
A
P
=
B
(
P
可逆
)
\Longleftrightarrow \boldsymbol{P}^{T}\boldsymbol{AP} = \boldsymbol{B}(\boldsymbol{P}可逆)
⟺PTAP=B(P可逆):
⟺ A 与 B \qquad\qquad\quad\quad\Longleftrightarrow \boldsymbol{A} 与 \boldsymbol{B} ⟺A与B有相同的秩、正负惯性指数
参考
- 矩阵的合同、矩阵合同的性质、合同的应用、线性替换的矩阵上表示:https://blog.csdn.net/qq_43940950/article/details/117337790
- 对称矩阵、Hermite矩阵、正交矩阵、酉矩阵、奇异矩阵、正规矩阵、幂等矩阵、合同矩阵、正定矩阵:https://www.cnblogs.com/yuluoxingkong/p/8534563.html
- 线性变换及其矩阵:https://web.xidian.edu.cn/qlhuang/files/20150705_224234.pdf