Table of Contents
摘自MOOC东南大学和同济大学《线性代数》
友情链接:高等代数-简书
矩阵(Matrix)
理解矩阵: https://blog.csdn.net/myan/article/details/647511
矩阵及其运算
矩阵的概念:
m
×
n
m× n
m×n 矩阵是指下列数表
(
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
)
\begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{m1}&a_{m2}&\cdots&a_{mn} \\ \end{pmatrix}
⎝⎜⎜⎜⎛a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎠⎟⎟⎟⎞矩阵常用大写黑体字母表示,如
A
A
A或
A
m
×
n
A_{m× n}
Am×n,有时也记
(
a
i
j
)
(a_{ij})
(aij)或
(
a
i
j
)
m
×
n
(a_{ij})_{m× n}
(aij)m×n 。
其中
a
i
j
a_{ij}
aij叫做矩阵
A
A
A中的
(
i
,
j
)
(i,j)
(i,j)元素(entry)。
根据矩阵的元素所属的数域,可以将矩阵分为复矩阵和实矩阵。
几种特殊的矩阵
(1) 两个矩阵
A
=
(
a
i
j
)
m
×
n
,
B
=
(
a
i
j
)
s
×
t
A=(a_{ij})_{m× n},B=(a_{ij})_{s× t}
A=(aij)m×n,B=(aij)s×t,若
m
=
s
,
n
=
t
m=s,n=t
m=s,n=t,则
A
A
A与
B
B
B是同型矩阵(Homomorphic matrix)。
(2) 元全为零的矩阵称为零矩阵(zero matrix),记作
O
m
×
n
O_{m× n}
Om×n或
O
O
O
(3) 行矩阵和列矩阵:
1
×
n
1× n
1×n型矩阵
(
a
1
,
a
2
,
⋯
,
a
n
)
(a_1,a_2,\cdots,a_n)
(a1,a2,⋯,an)只有一行,称为行矩阵(row matrix)或行向量。
m
×
1
m× 1
m×1型矩阵
(
a
1
a
2
⋮
a
n
)
\begin{pmatrix}a_1\\ a_2\\ \vdots \\ a_n\end{pmatrix}
⎝⎜⎜⎜⎛a1a2⋮an⎠⎟⎟⎟⎞只有一列,称为列矩阵(column matrix)或列向量。
(4) 行数和列数相等的矩阵为n阶方阵(n-order square matrix)或n阶矩阵。
几种特殊的方阵
(1) 上三角矩阵(upper triangular matrix)与下三角矩阵,未显示部分都为0。
(
a
11
a
12
⋯
a
1
n
a
22
⋯
a
2
n
⋱
⋮
a
n
n
)
\begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ &a_{22}&\cdots&a_{2n} \\ &&\ddots&\vdots \\ &&&a_{nn} \\ \end{pmatrix}\quad
⎝⎜⎜⎜⎛a11a12a22⋯⋯⋱a1na2n⋮ann⎠⎟⎟⎟⎞与
(
a
11
a
21
a
22
⋮
⋮
⋱
a
n
1
a
n
2
⋯
a
n
n
)
\quad\begin{pmatrix} a_{11}&&& \\ a_{21}&a_{22}&& \\ \vdots&\vdots&\ddots& \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{pmatrix}
⎝⎜⎜⎜⎛a11a21⋮an1a22⋮an2⋱⋯ann⎠⎟⎟⎟⎞
(2) 对角阵(diagonal matrix):记作
d
i
a
g
(
a
11
,
a
22
,
⋯
,
a
n
n
)
\mathrm{diag}(a_{11},a_{22},\cdots,a_{nn})
diag(a11,a22,⋯,ann),当
a
11
=
a
22
=
⋯
=
a
n
n
a_{11}=a_{22}=\cdots=a_{nn}
a11=a22=⋯=ann时,称为数量矩阵(scalar matrix),未显示部分都为0。
(
a
11
a
22
⋱
a
n
n
)
\begin{pmatrix} a_{11} \\ &a_{22} \\ &&\ddots \\ &&&a_{nn} \\ \end{pmatrix}
⎝⎜⎜⎛a11a22⋱ann⎠⎟⎟⎞
(3) 对角阵
d
i
a
g
(
1
,
1
,
⋯
,
1
)
\mathrm{diag}(1,1,\cdots,1)
diag(1,1,⋯,1)称为单位阵(identity matrix),记作
E
n
E_n
En或
I
n
I_n
In
(4) 对称阵(symmetric matrix)与反对称阵(skew-symmetric matrix):n阶方阵
A
=
(
a
i
j
)
n
×
n
A=(a_{ij})_{n× n}
A=(aij)n×n,若
a
i
j
=
a
j
i
a_{ij}=a_{ji}
aij=aji,称为n阶对称阵,若
a
i
j
=
−
a
j
i
a_{ij}=-a_{ji}
aij=−aji称为n阶反对称阵。
矩阵的线性运算(Matrix Algebra)
(1) 同型矩阵
A
=
(
a
i
j
)
m
×
n
与
B
=
(
b
i
j
)
m
×
n
A=(a_{ij})_{m× n}与B=(b_{ij})_{m× n}
A=(aij)m×n与B=(bij)m×n,如果他们的元对应相等
a
i
j
=
b
i
j
a_{ij}=b_{ij}
aij=bij,则称矩阵
A
A
A与
B
B
B相等,记作
A
=
B
A=B
A=B
(2) 矩阵的加法: 同型矩阵
A
=
(
a
i
j
)
m
×
n
与
B
=
(
b
i
j
)
m
×
n
A=(a_{ij})_{m× n}与B=(b_{ij})_{m× n}
A=(aij)m×n与B=(bij)m×n,
A
+
B
=
(
a
i
j
+
b
i
j
)
m
×
n
A+B=(a_{ij}+b_{ij})_{m× n}
A+B=(aij+bij)m×n
A + O = A A+O=A A+O=A |
---|
A + B = B + A A+B=B+A A+B=B+A |
( A + B ) + C = A + ( B + C ) (A+B)+C=A+(B+C) (A+B)+C=A+(B+C) |
(3) 矩阵的数乘:数 k k k与矩阵 A = ( a i j ) m × n A=(a_{ij})_{m× n} A=(aij)m×n, k A = ( k a i j ) m × n kA=(ka_{ij})_{m× n} kA=(kaij)m×n
( k + l ) A = k A + l A , k ( A + B ) = k A + k B (k+l)A=kA+lA,\quad k(A+B)=kA+kB (k+l)A=kA+lA,k(A+B)=kA+kB |
---|
( k l ) A = k ( l A ) = l ( k A ) (kl)A=k(lA)=l(kA) (kl)A=k(lA)=l(kA) |
k A = O ⟺ k = 0 或 A = O kA=O\iff k=0\ 或\ A=O kA=O⟺k=0 或 A=O |
矩阵的乘法
(1)矩阵的乘法:设矩阵
A
=
(
a
i
j
)
m
×
n
与
B
=
(
b
i
j
)
n
×
p
A=(a_{ij})_{m× n}与B=(b_{ij})_{n× p}
A=(aij)m×n与B=(bij)n×p,定义
A
B
=
(
c
i
j
)
m
×
p
AB=(c_{ij})_{m× p}
AB=(cij)m×p,其中
c
i
j
=
∑
k
=
1
n
a
i
k
b
k
j
,
(
i
=
1
,
2
,
⋯
,
m
;
j
=
1
,
2
,
⋯
,
p
)
c_{ij}=\displaystyle\sum_{k=1}^{n}a_{ik}b_{kj},(i=1,2,\cdots,m;j=1,2,\cdots,p)
cij=k=1∑naikbkj,(i=1,2,⋯,m;j=1,2,⋯,p)
A ( B C ) = ( A B ) C A(BC)=(AB)C A(BC)=(AB)C |
---|
A ( B + C ) = A B + A C ; ( B + C ) A = B A + C A A(B+C)=AB+AC;\ (B+C)A=BA+CA A(B+C)=AB+AC; (B+C)A=BA+CA |
k ( A B ) = ( k A ) B = A ( k B ) k(AB)=(kA)B=A(kB) k(AB)=(kA)B=A(kB) |
A E = A ; E A = A AE=A;\ EA=A AE=A; EA=A |
矩阵乘法不满足交换律和消去律
A B = B A AB\ \xcancel{=}\ BA AB = BA;
A B = A C ⇒ B = C AB=AC\xcancel{\Rarr} B=C AB=AC⇒ B=C
(2) 方阵的幂:设A为n阶方阵,定义 A 1 = A , A 2 = A A , ⋯ , A k + 1 = A k A A^1=A,\ A^2=AA,\cdots,A^{k+1}=A^kA A1=A, A2=AA,⋯,Ak+1=AkA
A k A l = A k + l A^kA^l=A^{k+l} AkAl=Ak+l |
---|
( A k ) l = A k l (A^k)^l=A^{kl} (Ak)l=Akl |
(3) 方阵的多项式: f ( A ) = a s A s + a s − 1 A s − 1 + ⋯ + a 1 A + a 0 E f(A)=a_sA^s+a_{s-1}A^{s-1}+\cdots+a_1A+a_0E f(A)=asAs+as−1As−1+⋯+a1A+a0E
矩阵的转置(transpose):设矩阵 A = ( a i j ) m × n , A T = ( a j i ) n × m A=(a_{ij})_{m× n},\ A^T=(a_{ji})_{n× m} A=(aij)m×n, AT=(aji)n×m叫做矩阵 A A A的转置矩阵
( A T ) T = A (A^T)^T=A (AT)T=A | ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT |
---|---|
( k A ) T = k A T (kA)^T=kA^T (kA)T=kAT | ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT |
矩阵的行列式:由n阶方阵A的元素所构成的行列式,称为A的行列式,记为 det A \det A detA或 ∣ A ∣ |A| ∣A∣
det A T = det A \det A^T=\det A detAT=detA |
---|
det k A = k n det A \det kA=k^n\det A detkA=kndetA |
det A B = det A ⋅ det B \det AB=\det A\cdot\det B detAB=detA⋅detB |
分块矩阵(Block matrix)
矩阵的分块:根据运算的需要,结合矩阵本身的特点,在矩阵的行间和列间,分别用横线和竖线将矩阵划分为若干个子矩阵(submatrix),此方法称为矩阵的分块,并称这种以子块为元的矩阵为分块矩阵。
(
1
0
0
0
0
1
0
0
0
0
1
5
)
=
(
E
O
A
1
A
2
)
\left( \def\arraystretch{1.2} \begin{array}{cc:c} 1&0 & 0 & 0 \\ 0&1 & 0 &0 \\ \hdashline 0&0 & 1 & 5 \end{array} \right)=\begin{pmatrix} E & O \\ A_1 & A_2 \end{pmatrix}
⎝⎜⎛100010001005⎠⎟⎞=(EA1OA2)
分块对角阵(block diagonal matrix):其中
A
1
,
A
2
,
⋯
,
A
s
A_1,A_2,\cdots,A_s
A1,A2,⋯,As是方阵,未显示部分都为0。
A
=
(
A
1
A
2
⋱
A
s
)
A=\begin{pmatrix} A_1 \\ &A_2 \\ &&\ddots& \\ &&&A_s \\ \end{pmatrix}
A=⎝⎜⎜⎛A1A2⋱As⎠⎟⎟⎞
按行和列分块:
A
=
(
A
1
,
A
2
,
⋯
,
A
n
)
;
A
=
(
α
1
α
2
⋮
α
m
)
A=(A_1,A_2,\cdots,A_n);\quad A=\begin{pmatrix}α_1\\ α_2\\ \vdots \\ α_m\end{pmatrix}
A=(A1,A2,⋯,An);A=⎝⎜⎜⎜⎛α1α2⋮αm⎠⎟⎟⎟⎞
证明:
A
=
O
⟺
A
T
A
=
O
A=O\iff A^TA=O
A=O⟺ATA=O
分块矩阵的运算 | 条件 |
---|---|
A m × n ± B m × n = ( A r s ) p × q ± ( B r s ) p × q = ( A r s + B r s ) p × q A_{m× n}± B_{m× n}=(A_{rs})_{p× q}± (B_{rs})_{p× q}=(A_{rs}+B_{rs})_{p× q} Am×n±Bm×n=(Ars)p×q±(Brs)p×q=(Ars+Brs)p×q | 加减法:两个同型矩阵进行同样的分块 |
k A m × n = k ( A r s ) p × q = ( k A r s ) p × q kA_{m× n}=k(A_{rs})_{p× q}=(kA_{rs})_{p× q} kAm×n=k(Ars)p×q=(kArs)p×q | 数乘 |
A
m
×
s
B
s
×
n
=
(
A
i
k
)
p
×
t
(
B
k
j
)
t
×
q
=
(
C
i
j
)
p
×
q
A_{m× s}B_{s× n}=(A_{ik})_{p× t}(B_{kj})_{t× q}=(C_{ij})_{p× q}
Am×sBs×n=(Aik)p×t(Bkj)t×q=(Cij)p×q 其中 C i j = ∑ k = 1 t a i k b k j ( i = 1 , 2 , ⋯ , p ; j = 1 , 2 , ⋯ , q ) C_{ij}=\displaystyle\sum_{k=1}^{t}a_{ik}b_{kj}\\ (i=1,2,\cdots,p;j=1,2,\cdots,q) Cij=k=1∑taikbkj(i=1,2,⋯,p;j=1,2,⋯,q) | 乘法: B B B的列分法和 A A A的行分法一致 |
A m × n = ( A r s ) p × q ⇒ A T = ( A r s T ) p × q A_{m× n}=(A_{rs})_{p× q}\Rarr A^T=(A^T_{rs})_{p× q} Am×n=(Ars)p×q⇒AT=(ArsT)p×q | 分块转置 |
矩阵的初等变换
初等变换(elementary transformation):行(列)初等变换
(1) 互换变换:
r
i
↔
r
j
或
c
i
↔
c
j
r_i\lrarr r_j或c_i\lrarr c_j
ri↔rj或ci↔cj
(2) 倍乘变换:
r
i
×
k
或
c
i
×
k
,
其
中
k
≠
0
r_i× k或c_i× k,其中k\neq0
ri×k或ci×k,其中k=0
(3) 倍加变换:
r
i
+
k
r
j
或
r
i
+
k
r
j
r_i+kr_j或r_i+kr_j
ri+krj或ri+krj
若
A
A
A经有限次初等变换变为
B
B
B,则
A
A
A与
B
B
B等价(equivalent),记为
A
≅
B
A \cong B
A≅B
任何矩阵A经有限次初等变换都可化为以下形式之一
(
E
r
O
O
O
)
\begin{pmatrix} E_r&O \\ O&O \end{pmatrix}
(ErOOO)、
(
E
r
,
O
)
(E_r,O)
(Er,O)、
(
E
r
O
)
\begin{pmatrix} E_r \\ O \end{pmatrix}
(ErO)
称为矩阵A的等价标准型(equivalent standard form),其中
r
r
r为矩阵
A
A
A的秩。
行阶梯型矩阵(Row echelon matrix):任何矩阵都可以通过初等变换化为行阶梯型
(1) 零行:元素全为0的行
(2) 非零行:元素不全为0的行
(3) 非零首元:非零行第一个不为0的元素
(4) 若有零行,则在最下方;非零首元的列随行的增加而严格递增
(
5
−
3
6
8
1
−
2
6
2
)
\begin{pmatrix} 5&-3&6&8 \\ &1&-2&6 \\ &&&2 \\ &&& \\ \end{pmatrix}
⎝⎜⎜⎛5−316−2862⎠⎟⎟⎞
行最简型矩阵(Row simplest matrix):任何矩阵都可以通过初等变换化为行最简型
(1) 行阶梯型矩阵
(2) 非零首元都是1
(3) 非零首元所在列的其他元素都是零
(
1
0
6
8
1
−
2
6
2
)
\begin{pmatrix} 1&0&6&8 \\ &1&-2&6 \\ &&&2 \end{pmatrix}
⎝⎛1016−2862⎠⎞
初等矩阵(elementary matrix):由单位矩阵
E
E
E经一次初等变化得到的矩阵叫初等矩阵
三种初等变换对应着三种初等矩阵
初等变换 | 初等矩阵 | 逆变换 | 逆矩阵 |
---|---|---|---|
r i ↔ r j r_i\lrarr r_j ri↔rj | E ( i , j ) E(i,j) E(i,j) | r i ↔ r j r_i\lrarr r_j ri↔rj | E ( i , j ) − 1 = E ( i , j ) E(i,j)^{-1}=E(i,j) E(i,j)−1=E(i,j) |
r i × k r_i× k ri×k | E ( i ( k ) ) E(i(k)) E(i(k)) | r i × 1 k r_i× \dfrac{1}{k} ri×k1 | E ( i ( k ) ) − 1 = E ( i ( 1 k ) ) E(i(k))^{-1}=E(i(\dfrac{1}{k})) E(i(k))−1=E(i(k1)) |
r i + k r j r_i+kr_j ri+krj | E ( i j ( k ) ) E(ij(k)) E(ij(k)) | r i − k r j r_i-kr_j ri−krj | E ( i j ( k ) ) − 1 = E ( i j ( − k ) ) E(ij(k))^{-1}=E(ij(-k)) E(ij(k))−1=E(ij(−k)) |
定理 :对矩阵
A
m
×
n
A_{m× n}
Am×n进行一次行初等变换,相当于
m
m
m阶初等矩阵左乘
A
A
A;进行一次列初等变换,相当于
n
n
n阶初等矩阵右乘
A
A
A
推论 :设
A
A
A与
B
B
B为
m
×
n
m× n
m×n矩阵
(1) 存在m阶初等矩阵
P
1
,
P
2
,
⋯
,
P
s
P_1,P_2,\cdots,P_s
P1,P2,⋯,Ps,使得
P
1
P
2
⋯
P
s
A
P_1P_2\cdots P_sA
P1P2⋯PsA为行阶梯型(行最简形)。
(2) 存在m阶初等矩阵
P
1
,
P
2
,
⋯
,
P
s
P_1,P_2,\cdots,P_s
P1,P2,⋯,Ps和n阶初等矩阵
Q
1
,
Q
2
,
⋯
,
Q
t
Q_1,Q_2,\cdots,Q_t
Q1,Q2,⋯,Qt,使得
P
1
P
2
⋯
P
s
A
Q
1
,
Q
2
,
⋯
,
Q
t
P_1P_2\cdots P_sAQ_1,Q_2,\cdots,Q_t
P1P2⋯PsAQ1,Q2,⋯,Qt为A的等价标准型。
(3) 若
A
≅
B
A\cong B
A≅B
⟺
\iff
⟺存在可逆矩阵
P
,
Q
P,Q
P,Q,使得
P
A
=
A
Q
=
B
PA=AQ=B
PA=AQ=B
⟺
\iff
⟺存在可逆矩阵
P
,
Q
P,Q
P,Q,使得
P
A
Q
=
B
PAQ=B
PAQ=B
利用初等变换解矩阵方程:
(1)
A
X
=
B
⇒
X
=
A
−
1
B
AX=B\Rarr X=A^{-1}B
AX=B⇒X=A−1B
利用行初等变换:
(
A
,
B
)
≅
(
E
,
A
−
1
B
)
(A,B)\cong (E,A^{-1}B)
(A,B)≅(E,A−1B)
(2)
Y
A
=
C
⇒
Y
=
C
A
−
1
YA=C\Rarr Y=CA^{-1}
YA=C⇒Y=CA−1
利用列初等变换:
(
A
B
)
≅
(
E
C
A
−
1
)
\begin{pmatrix}A\\ B\end{pmatrix}\cong\begin{pmatrix}E\\ CA^{-1}\end{pmatrix}
(AB)≅(ECA−1)
(3) 矩阵方程
A
X
=
B
AX=B
AX=B有解
⟺
r
(
A
)
=
r
(
A
,
B
)
\iff r(A)=r(A,B)
⟺r(A)=r(A,B)
逆矩阵
概念:对于n阶方阵 A A A,如果存在n阶方阵 B B B,使得 A B = B A = E AB=BA=E AB=BA=E,则 B B B为 A A A的逆矩阵,称 A A A为可逆矩阵(invertible matrix),记为 B = A − 1 B=A^{-1} B=A−1
( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A−1)−1=A | ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T |
---|---|
( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1 | ( k A ) − 1 = 1 k A − 1 , ( k ≠ 0 ) (kA)^{-1}=\dfrac{1}{k}A^{-1},(k\neq0) (kA)−1=k1A−1,(k=0) |
定理 1
(1) 初等矩阵都可逆,且逆矩阵仍是同类型的初等矩阵
(2) A的逆矩阵
A
−
1
A^{-1}
A−1是唯一的
(3) 对于矩阵
A
A
A,存在可逆矩阵
P
,
Q
P,Q
P,Q,使得
P
A
Q
PAQ
PAQ为
A
A
A的等价标准型
(4) 分块对角矩阵
A
=
d
i
a
g
(
A
1
,
A
2
,
⋯
,
A
s
)
A=\mathrm{diag}(A_1,A_2,\cdots,A_s)
A=diag(A1,A2,⋯,As)可逆
⟺
A
1
,
A
2
,
⋯
,
A
s
\iff A_1,A_2,\cdots,A_s
⟺A1,A2,⋯,As均可逆
定理 2:
n
n
n 阶矩阵
A
A
A 可逆
⟺
A
\iff A
⟺A可以写成有限个初等矩阵的乘积
⟺
A
≅
E
\iff A\cong E
⟺A≅E(等价于单位矩阵)
⟺
det
A
≠
0
\iff \det A\neq0
⟺detA=0(非奇异矩阵)
⟺
r
(
A
)
=
n
\iff r(A)=n
⟺r(A)=n(满秩矩阵)
⟺
A
\iff A
⟺A的行(列)向量组线性无关
⟺
\iff
⟺齐次线性方程组
A
x
=
0
Ax=0
Ax=0只有零解
⟺
∀
b
∈
R
n
\iff ∀ b\in \R^n
⟺∀b∈Rn,非齐次方程组
A
x
=
b
Ax=b
Ax=b有唯一解
⟺
A
\iff A
⟺A的特征值不全为零
⟺
A
T
A
\iff A^TA
⟺ATA是正定矩阵
⟺
A
\iff A
⟺A的行(列)向量组是
R
n
\R^n
Rn的一组基
伴随矩阵(adjoint matrix):由行列式 ∣ A ∣ |A| ∣A∣的各个元素的代数余子式 A i j A_{ij} Aij,所构成的矩阵 A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^*=\begin{pmatrix} A_{11}&A_{21}&\cdots&A_{n1} \\ A_{12}&A_{22}&\cdots&A_{n2} \\ \vdots&\vdots&\ddots&\vdots \\ A_{1n}&A_{2n}&\cdots&A_{nn} \\ \end{pmatrix} A∗=⎝⎜⎜⎜⎛A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann⎠⎟⎟⎟⎞叫做矩阵 A A A的伴随矩阵。 A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E AA∗=A∗A=∣A∣E
逆矩阵的计算
(1) 利用初等行变换:
(
A
,
E
)
≅
(
E
,
A
−
1
)
(A,E)\cong (E,A^{-1})
(A,E)≅(E,A−1)
(2) 利用初等列变换:
(
A
E
)
≅
(
E
A
−
1
)
\begin{pmatrix}A\\ E\end{pmatrix} \cong \begin{pmatrix} E\\ A^{-1} \end{pmatrix}
(AE)≅(EA−1)
(3) 利用伴随矩阵:
A
−
1
=
1
∣
A
∣
A
∗
A^{-1}=\dfrac{1}{|A|}A^*
A−1=∣A∣1A∗
矩阵的秩
概念:设矩阵
A
m
×
n
A_{m× n}
Am×n
(1) 在矩阵
A
A
A任取k行k列,位于这些行列交叉处的
k
2
k^2
k2个元素,不改变它们在
A
A
A中所处的位置次序而得的k阶行列式,称为矩阵
A
A
A的 k阶子式(minor)。
(2) 若矩阵
A
A
A中有一个不等于零的
r
r
r阶子式
D
D
D,且所有
r
+
1
r+1
r+1阶子式(如果存在的话)全等于零,那么
D
D
D称为矩阵
A
A
A的最高阶非零子式,数
r
r
r称为矩阵
A
A
A的秩(rank),记作
r
(
A
)
=
r
r(A)=r
r(A)=r。(规定零矩阵的秩等于零)
若
r
(
A
n
×
n
)
=
n
r(A_{n× n})=n
r(An×n)=n,则称
A
A
A为满秩矩阵(full rank matrix)
若
∣
A
n
×
n
∣
≠
0
|A_{n× n}|\neq 0
∣An×n∣=0,则称
A
A
A为非奇异矩阵(non-singular matrix)
矩阵秩的性质:
(1) 行阶梯形矩阵的秩就等于非零行的行数
(2) 初等变换不改变矩阵的秩
若
A
≅
B
A\cong B
A≅B,则
r
(
A
)
=
r
(
B
)
r(A)=r(B)
r(A)=r(B)
若
P
,
Q
P,Q
P,Q可逆,则
r
(
P
A
Q
)
=
r
(
A
)
r(PAQ)=r(A)
r(PAQ)=r(A)
(3) 若
∣
A
n
×
n
∣
=
0
|A_{n× n}|=0
∣An×n∣=0,则
r
(
A
)
<
n
r(A)<n
r(A)<n
(4)
r
(
A
T
)
=
r
(
A
)
r(A^T)=r(A)
r(AT)=r(A)
(5) 矩阵秩的不等式:
0
⩽
r
(
A
m
×
n
)
⩽
min
{
m
,
n
}
0⩽ r(A_{m× n})⩽\min\{m,n\}
0⩽r(Am×n)⩽min{m,n}
max
{
r
(
A
)
,
r
(
B
)
}
⩽
r
(
A
,
B
)
⩽
r
(
A
)
+
r
(
B
)
\max\{r(A),r(B)\}⩽ r(A,B)⩽ r(A)+r(B)
max{r(A),r(B)}⩽r(A,B)⩽r(A)+r(B)
r
(
A
B
)
⩽
min
{
r
(
A
)
,
r
(
B
)
}
r(AB) ⩽ \min\{r(A),r(B)\}
r(AB)⩽min{r(A),r(B)}
r
(
A
+
B
)
⩽
r
(
A
)
+
r
(
B
)
r(A+B)⩽ r(A)+r(B)
r(A+B)⩽r(A)+r(B)
线性方程组
概念
(1) 设有n个未知数m个方程的线性方程组(System of linear equations)
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
b
1
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
b
2
⋯
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
b
m
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \cdots \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯am1x1+am2x2+⋯+amnxn=bm当
b
1
,
b
2
,
⋯
,
b
n
b_1,b_2,\cdots,b_n
b1,b2,⋯,bn不全为零时称为非齐次线性方程组(system of non-homogeneous linear equations),当
b
1
=
b
2
=
⋯
=
b
m
=
0
b_1=b_2=\cdots=b_m=0
b1=b2=⋯=bm=0时称为齐次线性方程组(system of homogeneous linear equations)
(2) 如果存在n个常数
{
x
1
=
s
1
x
2
=
s
2
⋯
x
n
=
s
n
\begin{cases} x_1=s_1 \\ x_2=s_2 \\ \cdots \\ x_n=s_n \end{cases}
⎩⎪⎪⎪⎨⎪⎪⎪⎧x1=s1x2=s2⋯xn=sn 满足线性方程组的所有方程,则称为线性方程组的一个解。
(3) 记
A
=
(
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
m
1
a
m
2
⋯
a
m
n
)
A=\begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{m1}&a_{m2}&\cdots&a_{mn} \\ \end{pmatrix}
A=⎝⎜⎜⎜⎛a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎠⎟⎟⎟⎞,
x
=
(
x
1
x
2
⋮
x
n
)
x=\begin{pmatrix}x_1\\ x_2\\ \vdots \\ x_n\end{pmatrix}
x=⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞,
b
=
(
b
1
b
2
⋮
b
m
)
,
A
ˉ
=
(
A
,
b
)
b=\begin{pmatrix}b_1\\ b_2\\ \vdots \\ b_m\end{pmatrix},\bar{A}=(A,b)
b=⎝⎜⎜⎜⎛b1b2⋮bm⎠⎟⎟⎟⎞,Aˉ=(A,b)
其中
A
,
b
A,b
A,b分别是系数矩阵和常数项矩阵,
A
ˉ
\bar{A}
Aˉ为增广矩阵(augmented matrix),方程组可化为
A
x
=
b
Ax=b
Ax=b
线性方程组求解:对增广矩阵作初等行变换变为行阶梯形矩阵(行最简形矩阵)
高斯消元法(Gaussian Elimination)
(1)两方程互换,解不变;
(2)一方程乘以非零数k,解不变;
(3)一方程乘以数k加上另一方程,解不变 。
由求解情况可知,解的情况完全由其系数
a
i
j
a_{ij}
aij 和常数项
b
1
,
b
2
,
⋯
,
b
n
b_1,b_2,\cdots,b_n
b1,b2,⋯,bn 决定。
定理
n
n
n 元线性方程组
A
x
=
b
Ax=b
Ax=b
(1) 无解
⟺
r
(
A
)
<
r
(
A
,
b
)
\iff r(A)<r(A,b)
⟺r(A)<r(A,b)
(2) 有惟一解
⟺
r
(
A
)
=
r
(
A
,
b
)
=
n
\iff r(A)=r(A,b)=n
⟺r(A)=r(A,b)=n
(3) 有无限多解
⟺
r
(
A
)
=
r
(
A
,
b
)
<
n
\iff r(A)=r(A,b)<n
⟺r(A)=r(A,b)<n
解的性质和解的结构
(1)
A
x
=
0
Ax=0
Ax=0的任意两个解的线性组合仍是其解,一切解的集合构成向量空间,称为解空间
当
r
(
A
)
=
r
<
n
r(A)=r<n
r(A)=r<n时,解空间的基础解系含有
n
−
r
n-r
n−r个线性无关的解向量
η
1
,
η
2
,
⋯
,
η
n
−
r
η_1,η_2,\cdots,η_{n-r}
η1,η2,⋯,ηn−r,基础解系的一切线性组合
x
=
k
1
η
1
+
k
2
η
2
+
⋯
+
k
n
−
r
η
n
−
r
x=k_1η_1+k_2η_2+\cdots+k_{n-r}η_{n-r}
x=k1η1+k2η2+⋯+kn−rηn−r就是
A
x
=
0
Ax=0
Ax=0的通解
当
r
(
A
)
=
r
=
n
r(A)=r=n
r(A)=r=n时,解空间为零空间,没有基础解系
(2)
A
x
=
b
Ax=b
Ax=b的任意两个解之差,必为其导出组
A
x
=
0
Ax=0
Ax=0的解
一切解的集合不构成向量空间
任一解
η
0
η_0
η0与其导出组通解
x
ˉ
\bar{x}
xˉ 之和
x
=
η
0
+
x
ˉ
x=η_0+\bar{x}
x=η0+xˉ为其通解
最小二乘解(least squares solution):
x
0
x_0
x0为
A
x
=
b
Ax=b
Ax=b的最小二乘解,即
∥
b
−
A
x
0
∥
=
min
x
∈
R
n
∥
b
−
A
x
∥
⟺
x
0
\|b-Ax_0\|=\displaystyle\min_{x\in\R^n}\|b-Ax\| \iff x_0
∥b−Ax0∥=x∈Rnmin∥b−Ax∥⟺x0满足
A
T
A
x
0
=
A
T
b
A^TAx_0=A^Tb
ATAx0=ATb
行列式(Determinant)
行列式的本质是什么?https://www.zhihu.com/question/36966326/answer/70687817
行列式(determinant):行列式引自对线性方程组的求解
一阶行列式:
∣
a
11
∣
=
a
11
|a_{11}|=a_{11}
∣a11∣=a11
二阶行列式:
∣
a
11
a
12
a
21
a
22
∣
=
a
11
a
22
−
a
12
a
21
\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}
∣∣∣∣a11a21a12a22∣∣∣∣=a11a22−a12a21
三阶行列式:
∣
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
=
a
11
(
−
1
)
1
+
1
∣
a
22
a
23
a
32
a
33
∣
+
a
12
(
−
1
)
1
+
2
∣
a
11
a
13
a
31
a
33
∣
+
a
13
(
−
1
)
1
+
3
∣
a
21
a
22
a
31
a
32
∣
\begin{vmatrix} a_{11} & a_{12}& a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{vmatrix} =a_{11}(-1)^{1+1}\begin{vmatrix} a_{22} & a_{23} \\ a_{32} & a_{33} \end{vmatrix} +a_{12}(-1)^{1+2}\begin{vmatrix} a_{11} & a_{13} \\ a_{31} & a_{33} \end{vmatrix} +a_{13}(-1)^{1+3}\begin{vmatrix} a_{21} & a_{22} \\ a_{31} & a_{32} \end{vmatrix}
∣∣∣∣∣∣a11a21a31a12a22a32a13a23a33∣∣∣∣∣∣=a11(−1)1+1∣∣∣∣a22a32a23a33∣∣∣∣+a12(−1)1+2∣∣∣∣a11a31a13a33∣∣∣∣+a13(−1)1+3∣∣∣∣a21a31a22a32∣∣∣∣
n阶行列式:
∣
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
⋯
a
n
n
∣
=
∑
k
=
1
n
a
1
k
A
1
k
\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{vmatrix}=\displaystyle\sum_{k=1}^{n}a_{1k}A_{1k}
∣∣∣∣∣∣∣∣∣a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann∣∣∣∣∣∣∣∣∣=k=1∑na1kA1k其中,划去元
a
i
j
a_{ij}
aij所在的第
i
i
i行与第
j
j
j列的元,剩下的元不改变原来的顺序所构成的
n
−
1
n-1
n−1阶行列式称为元
a
i
j
a_{ij}
aij的余子式(cofactor),记为
M
i
j
M_{ij}
Mij,元
a
i
j
a_{ij}
aij的代数余子式 (algebraic cofactor)
A
i
j
=
(
−
1
)
i
+
j
M
i
j
A_{ij}=(-1)^{i+j}M_{ij}
Aij=(−1)i+jMij
二三阶行列式计算满足对角线法则,四阶及以上行列式不满足对角线法则。
n阶行列式按行(列)展开
∑
k
=
1
n
a
i
k
A
j
k
=
{
D
,
(
i
=
j
)
0
,
(
i
≠
j
)
∑
k
=
1
n
a
k
i
A
k
j
=
{
D
,
(
i
=
j
)
0
,
(
i
≠
j
)
\displaystyle\sum_{k=1}^{n}a_{ik}A_{jk}=\begin{cases}D,(i=j) \\ 0,(i\neq j)\end{cases}\quad \displaystyle\sum_{k=1}^{n}a_{ki}A_{kj}=\begin{cases}D,(i=j) \\ 0,(i\neq j)\end{cases}
k=1∑naikAjk={D,(i=j)0,(i=j)k=1∑nakiAkj={D,(i=j)0,(i=j)
其中
A
i
j
A_{ij}
Aij是行列式D中
a
i
j
a_{ij}
aij的代数余子式。
行列式的性质
(1) 行列式与其转置行列式相等:
D
=
D
T
D=D^T
D=DT
(2) 互换行列式两行(列),行列式改变符号:
A
→
(
c
i
↔
c
j
)
r
i
↔
r
j
B
⇒
∣
A
∣
=
−
∣
B
∣
A\xrightarrow[(c_i\lrarr c_j)]{r_i\lrarr r_j}B\Rarr | A|=-| B|
Ari↔rj(ci↔cj)B⇒∣A∣=−∣B∣
(3) 用数
k
k
k乘行列式等于行列式某一行(列)全部乘数
k
k
k。
A
→
(
k
c
i
)
k
r
i
B
⇒
k
∣
A
∣
=
∣
B
∣
A\xrightarrow[(kc_i)]{kr_i}B\Rarr k| A|=| B|
Akri(kci)B⇒k∣A∣=∣B∣
由此可得
a. 行列式某一行(列)的公因子可以提取到外面
b. 行列式某一行(列)全为零,则行列式值为零
(4) 若行列式中两行(列)对应元素成比例,则行列式值为零
(5) 把行列式的某一行全部
k
k
k倍加到另一行对应元素,行列式值不变
A
→
(
c
i
+
k
c
j
)
r
i
+
k
r
j
B
⇒
∣
A
∣
=
∣
B
∣
A\xrightarrow[(c_i+kc_j)]{r_i+kr_j}B\Rarr | A|=| B|
Ari+krj(ci+kcj)B⇒∣A∣=∣B∣
(6) 行列式的分拆定理,如
∣
b
11
+
c
11
b
12
+
c
12
b
13
+
c
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
=
∣
b
11
b
12
b
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
+
∣
c
11
c
12
c
13
a
21
a
22
a
23
a
31
a
32
a
33
∣
\begin{vmatrix} b_{11}+c_{11}&b_{12}+c_{12}&b_{13}+c_{13} \\ a_{21}&a_{22}&a_{23} \\ a_{31}&a_{32}&a_{33} \\ \end{vmatrix}=\begin{vmatrix} b_{11}&b_{12}&b_{13} \\ a_{21}&a_{22}&a_{23} \\ a_{31}&a_{32}&a_{33} \\ \end{vmatrix}+\begin{vmatrix} c_{11}&c_{12}&c_{13} \\ a_{21}&a_{22}&a_{23} \\ a_{31}&a_{32}&a_{33} \\ \end{vmatrix}
∣∣∣∣∣∣b11+c11a21a31b12+c12a22a32b13+c13a23a33∣∣∣∣∣∣=∣∣∣∣∣∣b11a21a31b12a22a32b13a23a33∣∣∣∣∣∣+∣∣∣∣∣∣c11a21a31c12a22a32c13a23a33∣∣∣∣∣∣
(7) 上、下三角行列式及主对角行列式等于主对角元素的乘积
副对角线上、下三角行列式及副对角行列式等于副对角元素的乘积
×
(
−
1
)
n
(
n
−
1
)
2
× (-1)^{\frac{n(n-1)}{2}}
×(−1)2n(n−1)
(8)
∣
−
A
∣
=
(
−
1
)
n
∣
A
∣
| -A|=(-1)^n |A|
∣−A∣=(−1)n∣A∣
(9)
∣
A
m
×
m
C
m
×
n
O
B
n
×
n
∣
=
∣
A
∣
×
∣
B
∣
\begin{vmatrix} A_{m× m} & C_{m× n} \\ O &B_{n× n} \end{vmatrix}=|A|×| B|
∣∣∣∣Am×mOCm×nBn×n∣∣∣∣=∣A∣×∣B∣
(10)
∣
A
1
A
2
⋱
A
s
∣
=
∣
A
1
∣
∣
A
2
∣
⋯
∣
A
s
∣
\begin{vmatrix} A_1 & & & \\ &A_2& & \\ & & \ddots& \\ & & & A_s \end{vmatrix}=|A_1||A_2|\cdots|A_s|
∣∣∣∣∣∣∣∣A1A2⋱As∣∣∣∣∣∣∣∣=∣A1∣∣A2∣⋯∣As∣,其中
A
1
,
A
2
,
⋯
,
A
s
A_1,A_2,\cdots,A_s
A1,A2,⋯,As都是方阵
(11)
∣
A
B
∣
=
∣
A
∣
×
∣
B
∣
|AB|=|A|×| B|
∣AB∣=∣A∣×∣B∣,其中
A
,
B
A,B
A,B为同阶方阵。
高阶行列式的计算
(1) 利用初等变换化为三角行列式
(2) 降价展开
范德蒙行列式(Vandermonde determinant)
D
n
=
∣
1
1
⋯
1
a
1
a
2
⋯
a
n
a
1
2
a
2
2
⋯
a
n
2
⋮
⋮
⋮
⋮
a
1
n
−
1
a
2
n
−
1
⋯
a
n
n
−
1
∣
=
∏
1
⩽
i
<
j
⩽
n
(
a
j
−
a
i
)
D_n=\begin{vmatrix} 1 & 1& \cdots &1 \\ a_1 &a_2&\cdots &a_n \\ a_1^2 &a_2^2&\cdots &a_n^2 \\ \vdots &\vdots&\vdots &\vdots \\ a_1^{n-1} &a_2^{n-1}&\cdots &a_n^{n-1} \end{vmatrix}=\displaystyle\prod_{1⩽ i<j⩽ n}(a_j-a_i)
Dn=∣∣∣∣∣∣∣∣∣∣∣1a1a12⋮a1n−11a2a22⋮a2n−1⋯⋯⋯⋮⋯1anan2⋮ann−1∣∣∣∣∣∣∣∣∣∣∣=1⩽i<j⩽n∏(aj−ai)
克拉默法则(Cramer rule):如果n元线性方程组 { a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n \begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \cdots \\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯an1x1+an2x2+⋯+annxn=bn的系数行列式 D ≠ 0 D\neq0 D=0,那么他有唯一解 x j = D j D , ( j = 1 , 2 , ⋯ , n ) x_j=\frac{D_j}{D},(j=1,2,\cdots,n) xj=DDj,(j=1,2,⋯,n)其中 D j D_j Dj是把系数行列式 D D D中的第 j j j列换成常数项 b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b1,b2,⋯,bn 所得的行列式
n维向量(N-dimensional Vector)
向量的概念和运算
n维向量(N-dimensional vector):n个有次序的数
a
1
,
a
2
,
⋯
,
a
n
a_1,a_2,\cdots,a_n
a1,a2,⋯,an 所组成的数组称为n维向量。
行向量
a
=
(
a
1
,
a
2
,
⋯
,
a
n
)
\mathbf a=(a_1,a_2,\cdots,a_n)
a=(a1,a2,⋯,an),列向量
a
=
(
a
1
a
2
⋯
a
n
)
\mathbf{a}=\begin{pmatrix}a_1\\ a_2\\ \cdots \\ a_n\end{pmatrix}
a=⎝⎜⎜⎛a1a2⋯an⎠⎟⎟⎞
分量全为实数的向量称为实向量;分量全为复数的向量称为复向量;
每个分量都是零的向量称为零向量,记作
0
\mathbf{0}
0;
向量的线性运算及性质:向量的线性运算及性质同行(列)矩阵线性运算一致。
向量组:若干个同维数的列(行)向量所构成的集合叫做向量组(vector group);含有限个向量的有序向量组与矩阵一一对应
向量组的线性表示与线性相关
向量的线性组合与线性表示:设向量组
A
:
α
1
,
α
2
,
⋯
,
α
r
A: α_1,α_2,\cdots,α_r
A:α1,α2,⋯,αr ,向量
β
=
k
1
α
1
+
k
2
α
2
+
⋯
+
k
n
α
r
β=k_1α_1+k_2α_2+\cdots+k_nα_r
β=k1α1+k2α2+⋯+knαr 则
β
β
β称为向量组的一个线性组合(linear combination),或称
β
β
β可由向量组
A
A
A 线性表示(linear representations),
k
1
,
k
2
,
⋯
,
k
r
k_1,k_2,\cdots,k_r
k1,k2,⋯,kr称为组合系数(combination coefficient)。
线性表示:
β
=
k
1
α
1
+
k
2
α
2
+
⋯
+
k
n
α
r
β=k_1α_1+k_2α_2+\cdots+k_nα_r
β=k1α1+k2α2+⋯+knαr
⟺
\iff
⟺线性方程组
A
x
=
β
Ax=β
Ax=β 有解
x
=
(
k
1
,
k
2
,
⋯
,
k
r
)
T
x=(k_1,k_2,\cdots,k_r)^T
x=(k1,k2,⋯,kr)T
⟺
r
(
A
)
=
r
(
A
,
β
)
\iff r(A)=r(A,β)
⟺r(A)=r(A,β)
向量组的线性表示与等价:设两向量组
A
:
α
1
,
α
2
,
⋯
,
α
r
;
B
:
β
1
,
β
2
,
⋯
,
β
s
A: α_1,α_2,\cdots,α_r;\ B: β_1,β_2,\cdots,β_s
A:α1,α2,⋯,αr; B:β1,β2,⋯,βs
若向量组
B
B
B中每一个向量皆可由向量组
A
A
A线性表示,即
B
=
A
K
r
×
s
B=AK_{r× s}
B=AKr×s 则称向量组
B
B
B可以由向量组
A
A
A 线性表示。若向量组
A
A
A与向量组
B
B
B 能相互线性表示,则称这两个向量组等价(equivalence)。
定理:向量组
B
B
B可以由向量组
A
A
A线性表示
⟺
\iff
⟺矩阵方程
A
X
=
B
AX=B
AX=B有解
⟺
r
(
A
)
=
r
(
A
,
B
)
\iff r(A)=r(A,B)
⟺r(A)=r(A,B)
⟹
r
(
B
)
⩽
r
(
A
)
\implies r(B)⩽ r(A)
⟹r(B)⩽r(A)
推论:向量组B与向量组 A等价
⟺
\iff
⟺矩阵方程
A
X
=
B
AX=B
AX=B与
B
Y
=
A
BY=A
BY=A同时有解
⟺
r
(
A
)
=
r
(
B
)
=
r
(
A
,
B
)
\iff r(A)=r(B)=r(A,B)
⟺r(A)=r(B)=r(A,B)
向量组线性相关与线性无关:向量组 A : α 1 , α 2 , ⋯ , α r A: α_1,α_2,\cdots,α_r A:α1,α2,⋯,αr,如果存在不全为零的数 k 1 , k 2 , ⋯ , k r k_1,k_2,\cdots,k_r k1,k2,⋯,kr,使得 k 1 α 1 + k 2 α 2 + ⋯ + k n α r = 0 k_1α_1+k_2α_2+\cdots+k_nα_r=0 k1α1+k2α2+⋯+knαr=0则称向量组A 线性相关(linearly dependence)。否则向量组A 线性无关(Linear Independence)。
向量组线性相关的判别
定理:向量组
A
:
α
1
,
α
2
,
⋯
,
α
m
A: α_1,α_2,\cdots,α_m
A:α1,α2,⋯,αm线性相关
⟺
m
\iff m
⟺m元线性方程组
A
x
=
0
Ax=0
Ax=0 有非零解
⟺
r
(
A
)
<
m
\iff r(A)<m
⟺r(A)<m
(1) 向量组线性相关
⟺
\iff
⟺向量组中至少存在一个向量可以由其余向量线性表示
向量组线性无关
⟺
\iff
⟺向量组中任意一个向量都不能由其余向量线性表示
(2) 若部分向量组线性相关,则整体向量组线性相关;若整体向量组线性无关,则它的任何部分组也线性无关
(3) 两个向量
α
α
α与
β
β
β线性相关(无关)
⟺
α
\iff α
⟺α与
β
β
β的分量对应成比例(不成比例)
(4) 向量个数多余
n
n
n的
n
n
n维向量组必线性相关;含零向量的向量组必线性相关。
(5) 设
α
1
,
α
2
,
⋯
,
α
m
α_1,α_2,\cdots,α_m
α1,α2,⋯,αm线性无关,
α
1
,
α
2
,
⋯
,
α
m
,
β
α_1,α_2,\cdots,α_m,β
α1,α2,⋯,αm,β线性相关,则
β
β
β可由
α
1
,
α
2
,
⋯
,
α
m
α_1,α_2,\cdots,α_m
α1,α2,⋯,αm线性表示
(6) 设
β
β
β可由
α
1
,
α
2
,
⋯
,
α
m
α_1,α_2,\cdots,α_m
α1,α2,⋯,αm线性表示,则表示法唯一的充分必要条件是
α
1
,
α
2
,
⋯
,
α
m
α_1,α_2,\cdots,α_m
α1,α2,⋯,αm线性无关
向量组的秩
定义:设向量组
A
A
A,在
A
A
A选取
r
r
r个向量
α
1
,
α
2
,
⋯
,
α
r
α_1,α_2,\cdots,α_r
α1,α2,⋯,αr满足:
(1) 向量组
A
0
:
α
1
,
α
2
,
⋯
,
α
r
A_0: α_1,α_2,\cdots,α_r
A0:α1,α2,⋯,αr线性无关
(2) 向量组
A
A
A中任取
r
+
1
r+1
r+1个向量(若存在)都线性相关
则称
A
0
A_0
A0为最大(线性)无关组(Maximum linearly independent group),所含的向量数
r
r
r叫做向量组
A
A
A的秩,记为
r
A
=
r
r_A=r
rA=r
注:
(1) 一个向量组的最大无关组是向量组中所含向量个数最多的线性无关的子组之一.
(2)一个向量组的最大无关组不一定是惟一的.
(3) 一个向量组与它的最大无关组是等价的
定理:矩阵的秩等于它的列向量组的秩,也等于它的行向量组的秩.
向量空间的概念和性质
向量空间(Vector spaces): 设
V
V
V 为
n
n
n 维向量的非空集合,
F
F
F 是一个数域,若
V
V
V 对于向量的加法和数乘两种运算封闭,那么称集合
V
V
V 为数域
F
F
F 上的向量空间。所谓封闭是指
(1)
∀
α
,
β
∈
V
,
α
+
β
∈
V
∀ \mathbf{α,β}\in V,\mathbf{α+β}\in V
∀α,β∈V,α+β∈V
(2)
∀
α
∈
V
,
λ
∈
F
,
λ
α
∈
V
∀ \mathbf{α}\in V, λ\in F, λ\mathbf{α}\in V
∀α∈V,λ∈F,λα∈V
示例
(1)
n
n
n维向量的全体
R
n
\R^n
Rn为向量空间:
R
n
=
{
(
x
1
,
x
2
,
⋯
,
x
n
)
T
∣
x
1
,
x
2
,
⋯
,
x
n
∈
R
}
\R^n=\{(x_1,x_2,\cdots,x_n)^T|x_1,x_2,\cdots,x_n\in\R\}
Rn={(x1,x2,⋯,xn)T∣x1,x2,⋯,xn∈R}
(2) 由向量组
a
1
,
a
2
,
⋯
,
a
m
a_1,a_2,\cdots,a_m
a1,a2,⋯,am 所生成的向量空间为:
L
=
{
x
=
λ
1
a
1
+
λ
2
a
2
+
⋯
+
λ
m
a
m
∣
λ
1
,
λ
2
,
⋯
,
λ
m
∈
R
}
L=\{x=λ_1a_1+λ_2a_2+\cdots+λ_ma_m|λ_1,λ_2,\cdots,λ_m\in\R\}
L={x=λ1a1+λ2a2+⋯+λmam∣λ1,λ2,⋯,λm∈R}
(3) n 元齐次线性方程组的解集
{
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
∈
R
n
∣
A
x
=
0
}
\{x=(x_1,x_2,\cdots,x_n)^T\in\R^n|Ax=0\}
{x=(x1,x2,⋯,xn)T∈Rn∣Ax=0}是向量空间, 齐次线性方程组的解空间
等价的向量组生成相同的向量空间。
子空间(subspaces): 设有线性空间
V
1
,
V
2
V_1,V_2
V1,V2,若
V
1
⊂
e
V
2
V_1⊂e V_2
V1⊂eV2,对于
V
1
V_1
V1 中
所定义的加法及乘数两种运算是封闭的,则称
V
1
V_1
V1是
V
2
V_2
V2的子空间(subspace)。
任何由
n
n
n 维向量组成的线性空间都是
R
n
\R^n
Rn的子空间。
基和维数(basis and dimension): 设
V
V
V 为数域
F
F
F 上的向量空间,向量
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr为
V
V
V 中的
r
r
r 个向量,并且满足
(1)
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr线性无关
(2)
V
V
V 中的每个向量都可由
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr 线性表示
则称向量组
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr为线性空间
V
V
V 的一个基,而基中所含向量的个数
r
r
r,称为向量空间
V
V
V的维数,称
V
V
V为
r
r
r维向量空间,记为
dim
V
=
r
\dim V=r
dimV=r
n
n
n维单位坐标向量组
e
1
,
e
2
,
⋯
,
e
n
\mathbf{e_1},\mathbf{e_2},\cdots,\mathbf{e_n}
e1,e2,⋯,en 是
R
n
\R^n
Rn的自然基,
dim
R
n
=
n
\dim \R^n=n
dimRn=n
e
1
=
(
1
0
⋮
0
)
,
e
2
=
(
0
1
⋮
0
)
,
⋯
,
e
n
=
(
0
0
⋮
1
)
\mathbf{e_1}=\begin{pmatrix}1\\0\\\vdots\\0\end{pmatrix},\mathbf{e_2}=\begin{pmatrix}0\\1\\\vdots\\0\end{pmatrix},\cdots,\mathbf{e_n}=\begin{pmatrix}0\\0\\\vdots\\1\end{pmatrix}
e1=⎝⎜⎜⎜⎛10⋮0⎠⎟⎟⎟⎞,e2=⎝⎜⎜⎜⎛01⋮0⎠⎟⎟⎟⎞,⋯,en=⎝⎜⎜⎜⎛00⋮1⎠⎟⎟⎟⎞
R
n
\R^n
Rn中任意
n
n
n个线性无关的
n
n
n维向量都是
R
n
\R^n
Rn的一组基。
向量组
A
:
a
1
,
a
2
,
⋯
,
a
m
A: \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m}
A:a1,a2,⋯,am所生成的向量空间
L
=
{
x
=
λ
1
a
1
+
λ
2
a
2
+
⋯
+
λ
m
a
m
∣
λ
1
,
λ
2
,
⋯
,
λ
m
∈
R
}
L=\{\mathbf{x}=λ_1\mathbf{a_1}+λ_2\mathbf{a_2}+\cdots+λ_m\mathbf{a_m}|λ_1,λ_2,\cdots,λ_m\in\R\}
L={x=λ1a1+λ2a2+⋯+λmam∣λ1,λ2,⋯,λm∈R}
若
a
1
,
a
2
,
⋯
,
a
m
\mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m}
a1,a2,⋯,am线性无关,则它是
L
L
L的一个基;
若
a
1
,
a
2
,
⋯
,
a
m
\mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_m}
a1,a2,⋯,am线性相关,他的最大无关组
A
0
:
a
1
,
a
2
,
⋯
,
a
r
A_0:\mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r}
A0:a1,a2,⋯,ar为
L
L
L的一个基,
dim
L
=
r
\dim L=r
dimL=r
坐标(coordinate):如果在 向量空间 V V V中选定一组基 a 1 , a 2 , ⋯ , a r \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r} a1,a2,⋯,ar,那么空间中任意一向量可唯一表示为 x = λ 1 a 1 + λ 2 a 2 + ⋯ + λ r a r \mathbf{x}=λ_1\mathbf{a_1}+λ_2\mathbf{a_2}+\cdots+λ_r\mathbf{a_r} x=λ1a1+λ2a2+⋯+λrar,其中数组 λ 1 , λ 2 , ⋯ , λ r λ_1,λ_2,\cdots,λ_r λ1,λ2,⋯,λr称为向量 x \mathbf{x} x在基 a 1 , a 2 , ⋯ , a r \mathbf{a_1},\mathbf{a_2},\cdots,\mathbf{a_r} a1,a2,⋯,ar中的坐标。并记作 x = ( λ 1 , λ 2 , ⋯ , λ r ) T \mathbf{x}=(λ_1,λ_2,\cdots,λ_r)^T x=(λ1,λ2,⋯,λr)T
基变换与坐标变换
基变换(change of bases):设
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn及
β
1
,
β
2
,
⋯
,
β
n
\mathbf{β_1,β_2,\cdots,β_n}
β1,β2,⋯,βn是
V
n
V_n
Vn的两组基,他们之间的关系式
(
β
1
,
β
2
,
⋯
,
β
n
)
=
(
α
1
,
α
2
,
⋯
,
α
n
)
P
(\mathbf{β_1,β_2,\cdots,β_n})=(\mathbf{α_1,α_2,\cdots,α_n})P
(β1,β2,⋯,βn)=(α1,α2,⋯,αn)P称为由
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn到
β
1
,
β
2
,
⋯
,
β
n
\mathbf{β_1,β_2,\cdots,β_n}
β1,β2,⋯,βn的基变换公式,
n
n
n维可逆矩阵
P
P
P 为由基
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn到基
β
1
,
β
2
,
⋯
,
β
n
\mathbf{β_1,β_2,\cdots,β_n}
β1,β2,⋯,βn的过渡矩阵(transition matrix),显然
P
−
1
P^{-1}
P−1 为由基
β
1
,
β
2
,
⋯
,
β
n
\mathbf{β_1,β_2,\cdots,β_n}
β1,β2,⋯,βn到基
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn的过渡矩阵。
坐标变换(coordinate transformation):设
a
∈
V
n
\mathbf{a}\in V_n
a∈Vn,它的基
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn与基
β
1
,
β
2
,
⋯
,
β
n
\mathbf{β_1,β_2,\cdots,β_n}
β1,β2,⋯,βn下的坐标分别为
(
x
1
,
x
2
,
⋯
,
x
n
)
T
(x_1,x_2,\cdots,x_n)^T
(x1,x2,⋯,xn)T与
(
x
1
′
,
x
2
′
,
⋯
,
x
n
′
)
T
(x'_1,x'_2,\cdots,x'_n)^T
(x1′,x2′,⋯,xn′)T,则有坐标变换公式
(
x
1
x
2
⋮
x
n
)
=
P
(
x
1
′
x
2
′
⋮
x
n
′
)
或
(
x
1
′
x
2
′
⋮
x
n
′
)
=
P
−
1
(
x
1
x
2
⋮
x
n
)
\begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix} =P\begin{pmatrix} x'_1 \\ x'_2 \\ \vdots\\ x'_n \end{pmatrix}\ 或\ \begin{pmatrix} x'_1 \\ x'_2 \\ \vdots\\ x'_n \end{pmatrix} =P^{-1}\begin{pmatrix} x_1 \\ x_2 \\ \vdots\\ x_n \end{pmatrix}
⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞=P⎝⎜⎜⎜⎛x1′x2′⋮xn′⎠⎟⎟⎟⎞ 或 ⎝⎜⎜⎜⎛x1′x2′⋮xn′⎠⎟⎟⎟⎞=P−1⎝⎜⎜⎜⎛x1x2⋮xn⎠⎟⎟⎟⎞
向量的内积、长度与正交性
内积(inner products):设 n n n维实向量 x = ( x 1 , x 2 , ⋯ , x n ) , y = ( y 1 , y 2 , ⋯ , y n ) \mathbf{x}=(x_1,x_2,\cdots,x_n),\mathbf{y}=(y_1,y_2,\cdots,y_n) x=(x1,x2,⋯,xn),y=(y1,y2,⋯,yn),定义内积为 [ x , y ] = x 1 y 1 + x 2 y 2 + ⋯ + x n y n = x y T \mathbf{[x,y]}=x_1y_1+x_2y_2+\cdots+x_ny_n=\mathbf{xy}^T [x,y]=x1y1+x2y2+⋯+xnyn=xyT
性质 | 表达式 |
---|---|
对称性 | [ x , y ] = [ y , x ] \mathbf{[x,y]}=\mathbf{[y,x]} [x,y]=[y,x] |
线性 | [ x + y , z ] = [ x , z ] + [ y , z ] [ k x , y ] = k [ x , y ] \mathbf{[x+y,z]=[x,z]+[y,z]} \\ [k\mathbf{x,y}]=k\mathbf{[x,y]} [x+y,z]=[x,z]+[y,z][kx,y]=k[x,y] |
正定性 | [ x , x ] ⩾ 0 \mathbf{[x,x]}⩾ 0 [x,x]⩾0 |
长度(模或范数):实数
∥
x
∥
=
[
x
,
x
]
=
x
1
2
+
x
2
2
+
⋯
+
x
n
2
\|\mathbf{x}\|=\sqrt{\mathbf{[x,x]}}=\sqrt{x_1^2+x_2^2+\cdots+x_n^2}
∥x∥=[x,x]=x12+x22+⋯+xn2
长度为1的向量称为单位向量。
性质 | 表达式 |
---|---|
正定性 | ∥ x ∥ ⩾ 0 \Vert\mathbf{x}\Vert ⩾ 0 ∥x∥⩾0 |
齐次性 | ∥ k x ∥ = ∣ k ∣ ⋅ ∥ x ∥ \Vert k\mathbf{x}\Vert=\vert k\vert \cdot\Vert \mathbf{x}\Vert ∥kx∥=∣k∣⋅∥x∥ |
三角不等式 | ∥ x + y ∥ ⩽ ∥ x ∥ + ∥ y ∥ \Vert\mathbf{x+y}\Vert⩽ \Vert \mathbf{x}\Vert+\Vert \mathbf{y}\Vert ∥x+y∥⩽∥x∥+∥y∥ |
柯西-施瓦兹不等式 | [ x , y ] 2 ⩽ [ x , x ] [ y , y ] \mathbf{[x,y]}^2⩽ \mathbf{[x,x]}\mathbf{[y,y]} [x,y]2⩽[x,x][y,y] |
向量之间的夹角: x \mathbf{x} x与 y \mathbf{y} y的夹角 θ = arccos [ x , y ] ∥ x ∥ ∥ y ∥ , ( 0 ⩽ θ ⩽ π ) θ=\arccos\dfrac{\mathbf{[x,y]}}{\|\mathbf{x}\|\|\mathbf{y}\|}, (0 ⩽θ ⩽π) θ=arccos∥x∥∥y∥[x,y],(0⩽θ⩽π)
正交(orthogonal):若
[
x
,
y
]
=
0
\mathbf{[x,y]}=0
[x,y]=0,则称向量
x
,
y
\mathbf{x,y}
x,y正交
(1) 若向量组中的向量两两正交,且均为非零向量,则这个向量组称为正交(向量)组。正交向量组线性无关。
(2) 由单位向量组成的正交组称为规范正交组。如
e
1
=
(
1
,
0
,
0
)
T
,
e
2
=
(
0
,
1
,
0
)
T
,
e
3
=
(
0
,
0
,
1
)
T
e_1=(1,0,0)^T,e_2=(0,1,0)^T,e_3=(0,0,1)^T
e1=(1,0,0)T,e2=(0,1,0)T,e3=(0,0,1)T
(3) 若正交向量组为向量空间
V
V
V上的一个基,则称为向量空间上的一个正交基(orthogonal basis)
(4) 若规范正交组为向量空间
V
V
V上的一个基,则称为向量空间上的一个规范正交基(orthonormal basis)
向量组的正交化
若
e
1
,
e
2
,
⋯
,
e
r
\mathbf{e_1},\mathbf{e_2},\cdots,\mathbf{e_r}
e1,e2,⋯,er 是向量空间
V
V
V的一个规范正交基
∀
x
∈
V
,
x
=
λ
1
e
1
+
λ
2
e
2
+
⋯
+
λ
r
e
r
⟹
λ
i
=
e
i
T
x
=
[
x
,
e
i
]
∀\mathbf{x}\in V,\mathbf{x}=λ_1\mathbf{e_1}+λ_2\mathbf{e_2}+\cdots+λ_r\mathbf{e_r}\implies λ_i=\mathbf{e_i}^T\mathbf{x}=[\mathbf{x,e_i}]
∀x∈V,x=λ1e1+λ2e2+⋯+λrer⟹λi=eiTx=[x,ei]
这就是向量在规范正交基中的坐标的计算公式,利用这个公式能方便地求得向量的坐标.
施密特正交化法(Schimidt orthogonalization)
设
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr是向量空间
V
V
V的一个基,寻找向量空间的一个规范正交基。也就是要找一组两两正交的单位向量
ξ
1
,
ξ
2
,
⋯
,
ξ
r
ξ_1,ξ_2,\cdots,ξ_r
ξ1,ξ2,⋯,ξr与
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr等价。
此问题称为把基
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr 规范正交化(orthonormalization)
(1) 正交化
令
β
1
=
α
1
,
β
2
=
α
2
−
[
β
1
,
α
2
]
[
β
1
,
β
1
]
β
1
,
β
3
=
α
3
−
[
β
1
,
α
3
]
[
β
1
,
β
1
]
β
1
−
[
β
2
,
α
3
]
[
β
2
,
β
2
]
β
2
,
β_1=α_1,β_2=α_2-\dfrac{[β_1,α_2]}{[β_1,β_1]}β_1,β_3=α_3-\dfrac{[β_1,α_3]}{[β_1,β_1]}β_1-\dfrac{[β_2,α_3]}{[β_2,β_2]}β_2,
β1=α1,β2=α2−[β1,β1][β1,α2]β1,β3=α3−[β1,β1][β1,α3]β1−[β2,β2][β2,α3]β2,
⋯
,
β
r
=
α
r
−
∑
k
=
1
r
−
1
[
β
k
,
α
r
]
[
β
k
,
β
k
]
β
k
\cdots,β_r=α_r-\displaystyle\sum_{k=1}^{r-1}\dfrac{[β_k,α_r]}{[β_k,β_k]}β_k
⋯,βr=αr−k=1∑r−1[βk,βk][βk,αr]βk
则
β
1
,
β
2
,
⋯
,
β
r
\mathbf{β_1,β_2,\cdots,β_r}
β1,β2,⋯,βr 正交,且与
α
1
,
α
2
,
⋯
,
α
r
\mathbf{α_1,α_2,\cdots,α_r}
α1,α2,⋯,αr等价
(2) 规范化
令
ξ
1
=
β
1
∥
β
1
∥
,
ξ
2
=
β
2
∥
β
2
∥
,
⋯
,
ξ
r
=
β
r
∥
β
r
∥
ξ_1=\dfrac{β_1}{\|β_1\|},ξ_2=\dfrac{β_2}{\|β_2\|},\cdots,ξ_r=\dfrac{β_r}{\|β_r\|}
ξ1=∥β1∥β1,ξ2=∥β2∥β2,⋯,ξr=∥βr∥βr
就得到
V
V
V的一个规范正交基
正交矩阵与正交变换
正交矩阵(orthogonal matrix):如果n阶矩阵A满足 A T A = E A^TA=E ATA=E (即 A − 1 = A T A^{-1}=A^T A−1=AT),那么称A为正交矩阵,简称正交阵。
正交矩阵的性质:
A
A
A 为正交阵
⟺
A
\iff A
⟺A 的行(列)向量组为规范正交向量组
⟺
A
T
\iff A^T
⟺AT为正交阵
⟺
A
−
1
\iff A^{-1}
⟺A−1为正交阵
⟹
∣
A
∣
2
=
1
\implies |A|^2=1
⟹∣A∣2=1为正交阵
A
,
B
A,B
A,B 为正交阵
⟹
A
B
\implies AB
⟹AB 为正交阵
正交变换(orthogonal transformation):若为 P P P正交矩阵,则线性变换 y = P x \mathbf{y}=P\mathbf{x} y=Px称为正交变换。
∥
y
∥
=
[
y
,
y
]
=
y
T
y
=
x
T
P
T
P
x
=
x
T
x
=
[
x
,
x
]
=
∥
x
∥
\|\mathbf{y}\|=\sqrt{[\mathbf{y,y}]}=\sqrt{\mathbf{y^Ty}} \\ =\sqrt{\mathbf{x^TP^TPx}} \\ =\sqrt{\mathbf{x^Tx}}=\sqrt{[\mathbf{x,x}]}=\|\mathbf{x}\|
∥y∥=[y,y]=yTy=xTPTPx=xTx=[x,x]=∥x∥
注:经正交变换后向量的长度保持不变,内积保持不变,从而夹角保持不变
相似矩阵(Similar Matrix)
矩阵的特征值和特征向量
定义
(1) 设
A
A
A是
n
n
n阶矩阵,如果数
λ
λ
λ和
n
n
n维非零向量
x
\mathbf{x}
x满足
A
x
=
λ
x
A\mathbf{x}=λ \mathbf{x}
Ax=λx,则这样的数
λ
λ
λ称为矩阵
A
A
A的特征值(eigenvalues),向量
x
\mathbf{x}
x称为
A
A
A的对应于特征值
λ
λ
λ的特征向量(eigenvectors)。
A
x
=
λ
x
⟺
(
A
−
λ
E
)
x
=
0
A\mathbf{x}=λ \mathbf{x} \iff (A-λ E)\mathbf{x}=0
Ax=λx⟺(A−λE)x=0有非零解
⟺
∣
A
−
λ
E
∣
=
0
\iff |A-λ E|=0
⟺∣A−λE∣=0
(2) 以
λ
λ
λ为未知数的一元n次方程
∣
A
−
λ
E
∣
=
0
|A-λ E|=0
∣A−λE∣=0称为A的特征方程(characteristic equation)。矩阵A的特征值就是它的特征方程的根.
(3)
f
(
λ
)
=
∣
A
−
λ
E
∣
f(λ)=|A-λ E|
f(λ)=∣A−λE∣称为矩阵A的特征多项式(characteristic polynomial)
特征值与特征向量的性质:
n 阶矩阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij) 在复数范围内有n个特征值,设特征值为
λ
1
,
λ
2
,
⋯
,
λ
n
λ_1,λ_2,\cdots,λ_n
λ1,λ2,⋯,λn,则
{
λ
1
+
λ
2
+
⋯
+
λ
n
=
A
=
a
11
+
a
22
+
⋯
+
a
n
n
λ
1
λ
2
⋯
λ
n
=
∣
A
∣
\begin{cases}λ_1+λ_2+\cdots+λ_n=\mathrm{A}=a_{11}+a_{22}+\cdots+a_{nn} \\ λ_1λ_2\cdotsλ_n=|A| \end{cases}
{λ1+λ2+⋯+λn=A=a11+a22+⋯+annλ1λ2⋯λn=∣A∣
设
λ
λ
λ 是方阵
A
A
A 的特征值,则
⟹
\implies
⟹
λ
λ
λ 是
A
T
A^T
AT的特征值
⟹
\implies
⟹ 当
A
A
A可逆时,
λ
−
1
λ^{-1}
λ−1是
A
−
1
A^{-1}
A−1 的特征值.
⟹
\implies
⟹
ϕ
(
λ
)
ϕ(λ)
ϕ(λ)是
ϕ
(
A
)
ϕ(A)
ϕ(A)的特征值
⟹
\implies
⟹ 属于不同特征值的特征向量是线性无关的
⟹
\implies
⟹ 对应于不同特征值的线性无关的特征向量组,合起来仍是线性无关的
特征值与特征向量的求法
步骤: (1) 写出A的特征多项式
∣
A
−
λ
E
∣
|A-λ E|
∣A−λE∣
(2). 解特征方程得n个特征值
λ
1
,
λ
2
,
⋯
,
λ
n
λ_1,λ_2,\cdots,λ_n
λ1,λ2,⋯,λn
(3). 对每个特征值
λ
i
λ_i
λi,求
(
A
−
λ
i
E
)
x
=
0
(A-λ_i E)\mathbf{x}=0
(A−λiE)x=0 的基础解系,写出其全体非零线性组合,即得
λ
i
λ_i
λi 的全体特征向量
相似矩阵
定义:设 A , B A, B A,B 都是 n n n 阶矩阵,若存在可逆阵 P P P ,使得 P − 1 A P = B P^{-1}AP=B P−1AP=B,则称A与B相似,记作 A ∼ B A∼ B A∼B,对 A 进行运算 P − 1 A P P^{-1}AP P−1AP 称为对 A进行相似变换(similarity transformation)。
性质:
(1) 相似关系为等价关系
反身性:
A
∼
A
A∼ A
A∼A
对称性:
A
∼
B
⟹
B
∼
A
A∼ B\implies B∼ A
A∼B⟹B∼A
传递性:
A
∼
B
,
B
∼
C
⟹
A
∼
C
A∼ B,B∼ C\implies A∼ C
A∼B,B∼C⟹A∼C
(2)
A
∼
B
A∼ B
A∼B
⟹
ϕ
(
A
)
∼
ϕ
(
B
)
\implies ϕ(A)∼ ϕ(B)
⟹ϕ(A)∼ϕ(B),其中
ϕ
ϕ
ϕ是一个多项式
⟹
r
(
A
)
=
r
(
B
)
且
∣
A
∣
=
∣
B
∣
\implies r(A)=r(B)且|A|=|B|
⟹r(A)=r(B)且∣A∣=∣B∣
⟹
∣
A
−
λ
E
∣
=
∣
B
−
λ
E
∣
\implies |A-λ E|= |B-λ E|
⟹∣A−λE∣=∣B−λE∣,特征多项式相同
⟹
A
\implies A
⟹A与
B
B
B 的特征值相同
⟹
t
r
A
=
t
r
B
\implies \mathrm{tr} A= \mathrm{tr} B
⟹trA=trB 迹(trace)相等(主对角线上元素的和)
矩阵的相似对角化(Similar diagonalization):若
A
n
×
n
∼
Λ
=
d
i
a
g
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
=
P
−
1
A
P
A_{n× n}∼Λ=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n)=P^{-1}AP
An×n∼Λ=diag(λ1,λ2,⋯,λn)=P−1AP ,则称
A
A
A 能相似对角化,对角线就是
A
A
A 的
n
n
n 个特征值。
假设已找到可逆阵
P
=
(
p
1
,
p
2
,
⋯
,
p
n
)
P=(p_1,p_2,\cdots,p_n)
P=(p1,p2,⋯,pn),
由
P
−
1
A
P
=
Λ
⟹
A
P
=
P
Λ
⟹
A
p
i
=
λ
i
p
i
(
i
=
1
,
2
,
⋯
,
n
)
P^{-1}AP=Λ \implies AP=PΛ\implies Ap_i=λ_ip_i(i=1,2,\cdots,n)
P−1AP=Λ⟹AP=PΛ⟹Api=λipi(i=1,2,⋯,n)
可见
λ
i
λ_i
λi 是
A
A
A的特征值,而
P
P
P 的列向量
p
i
p_i
pi 就是
A
A
A 的对应于特征值
λ
i
λ_i
λi 的特征向量。
定理 矩阵
A
n
×
n
A_{n× n}
An×n能相似对角化
⟺
A
\iff A
⟺A有n个线性无关的特征向量
⟺
\iff
⟺ 对于
A
A
A的每个
n
i
n_i
ni重特征值
λ
i
λ_i
λi,特征矩阵
λ
i
E
−
A
λ_iE-A
λiE−A的秩为
n
−
n
i
n-n_i
n−ni
⟸
A
\impliedby A
⟸A有n个互不相同的特征值
对称矩阵的对角化
对称矩阵特征值、特征向量的性质:设
A
n
×
n
A_{n× n}
An×n 为对称阵,特征值为
λ
1
,
λ
2
,
⋯
,
λ
n
λ_1,λ_2,\cdots,λ_n
λ1,λ2,⋯,λn
(1)
λ
1
,
λ
2
,
⋯
,
λ
n
∈
R
λ_1,λ_2,\cdots,λ_n \in \R
λ1,λ2,⋯,λn∈R
(2) 设
λ
1
,
λ
2
λ_1,λ_2
λ1,λ2 是对称矩阵
A
A
A 的两个特征值,
p
1
,
p
2
p_1,p_2
p1,p2 是对应的特征向量.,若
λ
1
≠
λ
2
λ_1\neq λ_2
λ1=λ2 则
p
1
,
p
2
p_1,p_2
p1,p2 正交,即
p
1
T
p
2
=
0
p_1^Tp_2=0
p1Tp2=0
(3) 任意对称阵
A
A
A,必有正交阵
P
P
P,使
P
−
1
A
P
=
P
T
A
P
=
d
i
a
g
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
P^{-1}AP=P^TAP=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n)
P−1AP=PTAP=diag(λ1,λ2,⋯,λn)
对称矩阵的正交对角化步骤:设
A
n
×
n
A_{n× n}
An×n 为对称阵
(1) 求出
A
A
A 的全部特征值,设为
λ
1
,
λ
2
,
⋯
,
λ
s
λ_1,λ_2,\cdots,λ_s
λ1,λ2,⋯,λs(两两不同),每个特征值分别有
l
1
,
l
2
,
⋯
,
l
s
l_1,l_2,\cdots,l_s
l1,l2,⋯,ls重(
l
1
+
l
2
+
⋯
+
l
s
=
n
l_1+l_2+\cdots+l_s=n
l1+l2+⋯+ls=n)
(2) 解
(
A
−
λ
i
E
)
x
=
0
(A-λ_iE)x=0
(A−λiE)x=0,求
A
A
A 的
l
i
l_i
li 个线性无关的
λ
i
λ_i
λi 特征向量
(3) 各组内部正交化、单位化
(4) 将各组向量并排得正交阵
P
n
×
n
P_{n× n}
Pn×n,则
P
−
1
A
P
=
P
T
A
P
=
Λ
=
d
i
a
g
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
P^{-1}AP=P^TAP=Λ=\mathrm{diag}(λ_1,λ_2,\cdots,λ_n)
P−1AP=PTAP=Λ=diag(λ1,λ2,⋯,λn)
二次型(Quadratic Form)
二次型及其标准型
概念:n元二次齐次多项式
f
(
x
1
,
x
2
,
⋯
,
x
n
)
=
∑
i
=
1
n
a
i
i
x
i
2
+
∑
1
⩽
i
<
j
⩽
n
2
a
i
j
x
i
x
j
f(x_1,x_2,\cdots,x_n)=\displaystyle\sum_{i=1}^{n}a_{ii}x_i^2+\displaystyle\sum_{1⩽ i<j⩽ n}2a_{ij}x_ix_j
f(x1,x2,⋯,xn)=i=1∑naiixi2+1⩽i<j⩽n∑2aijxixj
叫做二次型(quadratic form),可表示为矩阵形式
f
=
x
T
A
x
f=\mathbf{x}^TA\mathbf{x}
f=xTAx,其中
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
,
A
\mathbf{x}=(x_1,x_2,\cdots,x_n)^T,A
x=(x1,x2,⋯,xn)T,A为
n
n
n阶对称矩阵;(二次型
f
↔
f \lrarr
f↔实对称矩阵)
只含有平方项的二次型称为二次型的标准形(standard form);(标准型
↔
\lrarr
↔对角矩阵)
系数全为"+1"或"-1"的标准型叫做(二次型)的规范型(gauge form);
系数全为实数的二次型叫做实二次型。
二次型可通过满秩(或可逆)线性变换化为标准型
用正交变换将二次型标准化:具有保持几何形状不变的优点
定理:任意二次型
f
=
∑
i
,
j
=
1
n
a
i
j
x
i
x
j
(
a
i
j
=
a
j
i
)
f=\displaystyle\sum_{i,j=1}^{n}a_{ij}x_ix_j(a_{ij}=a_{ji})
f=i,j=1∑naijxixj(aij=aji),总有正交变换
x
=
P
y
x=Py
x=Py 化二次型为标准型
f
=
λ
1
y
1
2
+
λ
2
y
2
2
+
⋯
+
λ
n
y
n
2
f=λ_1y_1^2+λ_2y_2^2+\cdots+λ_ny_n^2
f=λ1y12+λ2y22+⋯+λnyn2,其中
λ
1
,
λ
2
,
⋯
,
λ
n
λ_1,λ_2,\cdots,λ_n
λ1,λ2,⋯,λn是
f
f
f的矩阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij) 的特征值。
推论:任意
n
n
n元二次型
f
=
x
T
A
x
(
A
T
=
A
)
f=\mathbf{x}^TA\mathbf{x} (A^T=A)
f=xTAx(AT=A),总有可逆变换
x
=
C
z
x=Cz
x=Cz,使
f
(
C
z
)
f(Cz)
f(Cz) 为规范型。
具体步骤如下:
(1) 将二次型表成矩阵形式
f
=
x
T
A
x
f=\mathbf{x}^TA\mathbf{x}
f=xTAx,求出
A
A
A
(2) 求出
A
A
A的所有特征值
λ
1
,
λ
2
,
⋯
,
λ
n
λ_1,λ_2,\cdots,λ_n
λ1,λ2,⋯,λn
(3) 求出对应于特征值的特征向量
ξ
1
,
ξ
2
,
⋯
,
ξ
n
ξ_1,ξ_2,\cdots,ξ_n
ξ1,ξ2,⋯,ξn
(4) 将特征向量
ξ
1
,
ξ
2
,
⋯
,
ξ
n
ξ_1,ξ_2,\cdots,ξ_n
ξ1,ξ2,⋯,ξn正交化、单位化,得
P
=
(
p
1
,
p
2
,
⋯
,
p
n
)
P=(p_1,p_2,\cdots,p_n)
P=(p1,p2,⋯,pn)
(5) 作正交变换
x
=
P
y
x=Py
x=Py 化二次型为标准型
f
=
λ
1
y
1
2
+
λ
2
y
2
2
+
⋯
+
λ
n
y
n
2
f=λ_1y_1^2+λ_2y_2^2+\cdots+λ_ny_n^2
f=λ1y12+λ2y22+⋯+λnyn2
拉格朗日配方法化二次型为标准型
主要步骤如下:
(1) 设二次型含有
x
i
x_i
xi的平方项,则把含有
x
i
x_i
xi的项集中,然后按
x
i
x_i
xi配成平方项,对其他变量也做类似处理,知道都配成平方项为止。
(2) 若在二次型中没有平方项,但
a
i
j
≠
0
(
i
≠
j
)
a_{ij}\neq 0(i\neq j)
aij=0(i=j) ,则做可逆线性变换
x
i
=
y
i
−
y
j
,
x
j
=
y
i
+
y
j
,
x
k
=
y
k
(
k
≠
i
,
j
)
x_i=y_i-y_j, x_j=y_i+y_j, x_k= y_k(k\neq i,j)
xi=yi−yj,xj=yi+yj,xk=yk(k=i,j),化二次型为含平方项的二次型,再按(1) 中的方法配方。
矩阵的合同与惯性定理
合同矩阵(congruent matrices;cogradient matrices):设
A
A
A 和
B
B
B 是
n
n
n 阶矩阵,若有可逆矩阵
C
C
C ,使
B
=
C
T
A
C
B=C^TAC
B=CTAC,则称矩阵
A
A
A 与
B
B
B 合同,记为
A
≃
B
A≃ B
A≃B
合同矩阵的性质
(1). 合同关系为等价关系
反身性:
A
≃
A
A≃ A
A≃A
对称性:
A
≃
B
⟹
B
≃
A
A≃ B\implies B≃ A
A≃B⟹B≃A
传递性:
A
≃
B
,
B
≃
C
⟹
A
≃
C
A≃ B,B≃ C\implies A≃ C
A≃B,B≃C⟹A≃C
(2). 与对称矩阵合同的矩阵也是对称矩阵
(3). 合同矩阵具有相同的秩.
惯性定理 (inertia theorem):设二次型
f
=
x
T
A
x
f=\mathbf{x}^TA\mathbf{x}
f=xTAx的秩为
r
r
r,有两个可逆变换
x
=
C
y
x=Cy
x=Cy及
x
=
P
z
x=Pz
x=Pz,
使
f
=
k
1
y
1
2
+
k
2
y
2
2
+
⋯
+
k
r
y
r
2
(
k
i
≠
0
)
f=k_1y_1^2+k_2y_2^2+\cdots+k_ry_r^2\quad(k_i\neq0)
f=k1y12+k2y22+⋯+kryr2(ki=0)
及
f
=
λ
1
z
1
2
+
λ
2
z
2
2
+
⋯
+
λ
r
z
r
2
(
λ
i
≠
0
)
f=λ_1z_1^2+λ_2z_2^2+\cdots+λ_rz_r^2\quad(λ_i\neq0)
f=λ1z12+λ2z22+⋯+λrzr2(λi=0)
则
k
1
,
k
2
,
⋯
,
k
r
k_1,k_2,\cdots,k_r
k1,k2,⋯,kr中正数得个数与
λ
1
,
λ
2
,
⋯
,
λ
r
λ_1,λ_2,\cdots,λ_r
λ1,λ2,⋯,λr中正数得个数相等。
二次型的标准形中,
负系数的个数称为二次型的负惯性指数(Negative inertia index)
正系数的个数称为二次型的正惯性指数(Positive inertia index)
若二次型
f
f
f 的正惯性指数为
p
p
p ,秩为
r
r
r ,
则
f
f
f 的规范形便可确定为
f
=
y
1
2
+
y
2
2
+
⋯
+
y
p
2
−
y
p
+
1
2
−
⋯
−
y
r
2
f=y_1^2+y_2^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2
f=y12+y22+⋯+yp2−yp+12−⋯−yr2
正定二次型
定义:设二次型
f
(
x
)
=
x
T
A
x
f(\mathbf{x})=\mathbf{x}^TA\mathbf{x}
f(x)=xTAx,如果对任何
x
≠
0
\mathbf{x}\neq\mathbf{0}
x=0 都有
f
(
x
)
>
0
f(\mathbf{x})>0
f(x)>0(显然
f
(
0
)
=
0
f(\mathbf{0})=0
f(0)=0),则称
f
f
f 为正定二次型(positive definite quadratic form),并称对称阵
A
A
A 是正定矩阵(positive definite matrix)。
非退化线性替换不改变二次型的正定性。
正定矩阵的判别法:二次型
f
(
x
)
=
x
T
A
x
f(\mathbf{x})=\mathbf{x}^TA\mathbf{x}
f(x)=xTAx 正定,其中
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
\mathbf{x}=(x_1,x_2,\cdots,x_n)^T
x=(x1,x2,⋯,xn)T
⟺
∀
x
≠
0
,
x
T
A
x
>
0
\iff ∀\mathbf{x}\neq\mathbf{0},\mathbf{x}^TA\mathbf{x}>0
⟺∀x=0,xTAx>0
⟺
A
\iff A
⟺A的特征值全大于零
⟺
f
\iff f
⟺f的正惯性指数为
n
n
n
⟺
A
\iff A
⟺A与单位矩阵合同
⟺
\iff
⟺存在可逆矩阵
C
C
C,使得
A
=
C
C
T
A=CC^T
A=CCT
⟺
A
\iff A
⟺A的各阶顺序主子式均大于零
D
1
=
a
11
>
0
,
D
2
=
∣
a
11
a
12
a
21
a
22
∣
>
0
,
⋯
,
D
n
=
∣
A
∣
>
0
D_1=a_{11}>0, D_2=\begin{vmatrix} a_{11}&a_{12} \\ a_{21}&a_{22} \end{vmatrix}>0,\cdots,D_n=|A|>0
D1=a11>0,D2=∣∣∣∣a11a21a12a22∣∣∣∣>0,⋯,Dn=∣A∣>0
线性变换(Linear Transformation)
线性空间的定义与性质
线性空间(linear space): 设
V
V
V 为 非空集合,
R
\R
R 为实数域,若
V
V
V 对于向量的加法和数乘两种运算封闭,且满足八条运算规律,那么称集合
V
V
V 为实数域
R
\R
R 上的线性空间。封闭是指
(1)
∀
α
,
β
∈
V
,
∃
!
γ
=
α
+
β
∈
V
∀ \mathbf{α,β}\in V,∃! \mathbf{γ=α+β}\in V
∀α,β∈V,∃!γ=α+β∈V
(2)
∀
α
∈
V
,
λ
∈
R
,
∃
!
δ
=
λ
α
∈
V
∀ \mathbf{α}\in V, λ\in \R, ∃! \mathbf{δ}=λ\mathbf{α}\in V
∀α∈V,λ∈R,∃!δ=λα∈V
八条运算规律 | α , β , γ ∈ V , λ , μ ∈ R α,β,γ\in V,λ,μ\in\R α,β,γ∈V,λ,μ∈R |
---|---|
( i ) α + β = β + α (\mathbf{i})\ α+β=β+α (i) α+β=β+α | ( i i ) ( α + β ) + γ = α + ( β + γ ) (\mathbf{ii})\ (α+β)+γ=α+(β+γ) (ii) (α+β)+γ=α+(β+γ) |
( i i i ) ∃ Θ ∈ V , ∀ α ∈ V , α + Θ = α (\mathbf{iii})\ ∃ Θ\in V,∀ α\in V,α+Θ=α (iii) ∃Θ∈V,∀α∈V,α+Θ=α (零元素) | ( i v ) ∀ α ∈ V , ∃ β ∈ V , α + β = Θ (\mathbf{iv})\ ∀ α\in V,∃ β\in V, α+β=Θ (iv) ∀α∈V,∃β∈V,α+β=Θ (负元素) |
( v ) 1 α = α (\mathbf{v})\ 1α=α (v) 1α=α | ( v i ) ( λ μ ) α = λ ( μ α ) (\mathbf{vi})\ (λμ)α=λ(μα) (vi) (λμ)α=λ(μα) |
( v i i ) ( λ + μ ) α = λ α + μ α (\mathbf{vii})\ (λ+μ)α=λα+μα (vii) (λ+μ)α=λα+μα | ( v i i i ) λ ( α + β ) = λ α + λ β (\mathbf{viii})\ λ(α+β)=λα+λβ (viii) λ(α+β)=λα+λβ |
说明:
(1) 满足八条运算规律的加法与数乘运算,就称为线性运算,
凡定义了线性运算的集合就称为线性空间,元 素就称为向量.
(2) 向量不一定是有序数组.
(3) 线性空间的运算不一定是有序数组的加法及数乘运算.
注意:
线性空间的概念是集合与运算二者的结合。同一个集合,若 定义两种不同的线性运算,就构成不同的线性空间; 若定义的运算不是线性运算,就不能构成线性空间。
线性空间实例
向量类:
(1).全体 n 维向量
R
\R
R 在向量的加法与数乘下
(2).向量空间
(3).齐次线性方程组的解空间
矩阵类:
(1).全体
m
×
n
m× n
m×n 阵在矩阵加法和数乘下
(2).全体n阶方阵
(3).全体n阶对称阵
(4).全体n阶对角阵
多项式类:次数不超过 n 的实一元多项式的全体
P
[
x
]
n
=
{
p
=
a
n
x
n
+
⋯
+
a
1
x
+
a
0
∣
a
n
,
⋯
,
a
1
,
a
0
∈
R
}
P[x]_n=\{p=a_nx_n+\cdots+a_1x+a_0|a_n,\cdots,a_1,a_0\in\R\}
P[x]n={p=anxn+⋯+a1x+a0∣an,⋯,a1,a0∈R},
对于通常的多项式的加法和数乘多项式的乘法.
函数类:正弦函数的集合
S
[
x
]
=
{
s
=
A
sin
(
x
+
B
)
∣
A
,
B
∈
R
}
S[x]=\{s=A\sin(x+B)|A,B\in\R\}
S[x]={s=Asin(x+B)∣A,B∈R},
对于通常的函数加法和数乘函数的乘法.
线性空间的基本性质
(1) 零元素
Θ
Θ
Θ 是惟一的
(2) 任一向量的负向量是惟一的,
α
α
α 的负向量记作
−
α
-α
−α
(3)
0
α
=
Θ
,
(
−
1
)
α
=
−
α
,
λ
Θ
=
Θ
0α=Θ,(-1)α=-α,λΘ=Θ
0α=Θ,(−1)α=−α,λΘ=Θ
(4)
λ
α
=
Θ
⟹
λ
=
0
或
α
=
Θ
λα=Θ\implies λ=0或α=Θ
λα=Θ⟹λ=0或α=Θ
子空间(subspace):设
V
V
V 是一个线性空间,
L
L
L 是
V
V
V 的一个非空子集,如果
L
L
L对于
V
V
V 中所定义的加法和数乘两种运算也构成一个线性空间,则称
L
L
L 为
V
V
V 的子空间.
定理 线性空间
V
V
V 的非空子集
L
L
L 构成子空间
⟺
L
\iff L
⟺L 对于
V
V
V 中的线性运算封闭
基、维数和坐标:定义同向量空间
同构(isomorphism):设U 与V 是两个线性空间,如 果它们的向量之间有一一对应关系,且 这个对应关系保持线性组合的对应,就说线性空间U 与V 同构,记作 U ≅ V U\cong V U≅V
设在n 维线性空间
V
n
V_n
Vn 中取定一个基
α
1
,
α
2
,
⋯
,
α
n
α_1,α_2,\cdots,α_n
α1,α2,⋯,αn ,则
∀
α
,
β
∈
V
n
∀α,β\in V_n
∀α,β∈Vn
α
↔
(
x
1
,
x
2
,
⋯
,
x
n
)
T
,
β
↔
(
y
1
,
y
2
,
⋯
,
y
n
)
T
α\lrarr (x_1,x_2,\cdots,x_n)^T,β\lrarr (y_1,y_2,\cdots,y_n)^T
α↔(x1,x2,⋯,xn)T,β↔(y1,y2,⋯,yn)T
这个一一对应关系保持线性组合的对应:
(1)
α
+
β
↔
(
x
1
,
x
2
,
⋯
,
x
n
)
T
+
(
y
1
,
y
2
,
⋯
,
y
n
)
T
α+β\lrarr (x_1,x_2,\cdots,x_n)^T+ (y_1,y_2,\cdots,y_n)^T
α+β↔(x1,x2,⋯,xn)T+(y1,y2,⋯,yn)T
(2)
λ
α
↔
λ
(
x
1
,
x
2
,
⋯
,
x
n
)
T
λα\lrarr λ(x_1,x_2,\cdots,x_n)^T
λα↔λ(x1,x2,⋯,xn)T
称
V
n
V_n
Vn与
R
n
\R^n
Rn 同构,记作
V
n
≅
R
n
V_n\cong\R^n
Vn≅Rn
任何n 维线性空间都与 R n \R^n Rn 同构,即维数相等的线性空间都同构。线性空间的结构完全被它的维数所决定。
基变换与坐标变换:同向量空间
线性空间
p
[
x
]
3
p[x]_3
p[x]3实例
(1) 取一个基
p
1
=
1
,
p
2
=
x
,
p
3
=
x
2
,
p
4
=
x
3
p_1=1,p_2=x,p_3=x^2,p_4=x^3
p1=1,p2=x,p3=x2,p4=x3,求坐标
任一不超过3 次的多项式
p
=
a
3
x
3
+
a
2
x
2
+
a
1
x
+
a
0
p=a_3x^3+a_2x^2+a_1x+a_0
p=a3x3+a2x2+a1x+a0
都可表示为
p
=
a
0
p
1
+
a
1
p
2
+
a
2
p
3
+
a
3
p
4
p=a_0p_1+a_1p_2+a_2p_3+a_3p_4
p=a0p1+a1p2+a2p3+a3p4
因此
p
p
p 在这个基中的坐标为
(
a
0
,
a
1
,
a
2
,
a
3
)
T
(a_0,a_1,a_2,a_3)^T
(a0,a1,a2,a3)T
(2) 任取两个基,求坐标变换公式
a
1
=
x
3
+
2
x
2
−
x
b
1
=
2
x
3
+
x
2
+
1
a
2
=
x
3
−
x
2
+
x
+
1
b
2
=
x
2
+
2
x
+
2
a
3
=
−
x
3
+
2
x
2
+
x
+
1
b
3
=
−
2
x
3
+
x
2
+
x
+
2
a
4
=
−
x
3
−
x
2
+
1
b
4
=
x
3
+
3
x
2
+
x
+
2
\begin{array}{c:c} a_1=x^3+2x^2-x & b_1=2x^3+x^2+1 \\ a_2=x^3-x^2+x+1 & b_2=x^2+2x+2 \\ a_3=-x^3+2x^2+x+1 & b_3=-2x^3+x^2+x+2 \\ a_4=-x^3-x^2+1 & b_4=x^3+3x^2+x+2 \\ \end{array}
a1=x3+2x2−xa2=x3−x2+x+1a3=−x3+2x2+x+1a4=−x3−x2+1b1=2x3+x2+1b2=x2+2x+2b3=−2x3+x2+x+2b4=x3+3x2+x+2
将
b
1
,
b
2
,
b
3
,
b
4
b_1,b_2,b_3,b_4
b1,b2,b3,b4 用
a
1
,
a
2
,
a
3
,
a
4
a_1,a_2,a_3,a_4
a1,a2,a3,a4 表示
(
a
1
,
a
2
,
a
3
,
a
4
)
=
(
x
3
,
x
2
,
x
,
1
)
A
,
(
b
1
,
b
2
,
b
3
,
b
4
)
=
(
x
3
,
x
2
,
x
,
1
)
B
(a_1,a_2,a_3,a_4)=(x^3,x^2,x,1)A ,\\ (b_1,b_2,b_3,b_4)=(x^3,x^2,x,1)B
(a1,a2,a3,a4)=(x3,x2,x,1)A,(b1,b2,b3,b4)=(x3,x2,x,1)B,求得
A = ( 1 1 − 1 − 1 2 − 1 2 − 1 − 1 1 1 0 0 1 1 1 ) , B = ( 2 0 − 2 1 1 1 1 3 0 2 1 1 1 2 2 2 ) A=\begin{pmatrix} 1&1&-1&-1 \\ 2&-1&2&-1 \\ -1&1&1&0 \\ 0&1&1&1 \\ \end{pmatrix},\ B=\begin{pmatrix} 2&0&-2&1 \\ 1&1&1&3 \\ 0&2&1&1 \\ 1&2&2&2 \\ \end{pmatrix} A=⎝⎜⎜⎛12−101−111−1211−1−101⎠⎟⎟⎞, B=⎝⎜⎜⎛21010122−21121312⎠⎟⎟⎞
( b 1 , b 2 , b 3 , b 4 ) = ( a 1 , a 2 , a 3 , a 4 ) A − 1 B (b_1,b_2,b_3,b_4)=(a_1,a_2,a_3,a_4)A^{-1}B (b1,b2,b3,b4)=(a1,a2,a3,a4)A−1B
故坐标变换公式为 ( x 1 ′ x 2 ′ x 3 ′ x 4 ′ ) = B − 1 A ( x 1 x 2 x 3 x 4 ) \begin{pmatrix} x_1' \\ x_2' \\ x_3' \\ x_4' \\ \end{pmatrix}=B^{-1}A\begin{pmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \\ \end{pmatrix} ⎝⎜⎜⎛x1′x2′x3′x4′⎠⎟⎟⎞=B−1A⎝⎜⎜⎛x1x2x3x4⎠⎟⎟⎞
用矩阵的初等行变换求
B
−
1
A
B^{-1}A
B−1A
(
B
,
A
)
∼
(
E
,
B
−
1
A
)
(B,A)∼(E,B^{-1}A)
(B,A)∼(E,B−1A)
线性变换
变换(transformation):设 A , B A,B A,B是两个非空集合,如果对于 A A A中任一元素 α α α,按某法则总有 B B B中唯一确定的元素 β β β与之对应,则称这个对应法则为从集合 A A A到集合 B B B的变换(或映射),若记此法则为 T T T,则上述变换可表示为: β = T ( α ) β=T(α) β=T(α)或 β = T α β=Tα β=Tα,并称 α α α为源, β β β为像, A A A为源集,像的全体组成的集合称为像集。
线性变换(linear transformation):设
V
n
,
U
m
V_n,U_m
Vn,Um分别为
n
n
n维和
m
m
m维线性空间,线性变换
T
:
V
n
→
U
m
T: V_n\to U_m
T:Vn→Um满足
(1)
∀
α
,
β
∈
V
n
,
T
(
α
+
β
)
=
T
(
α
)
+
T
(
β
)
∀ α,β\in V_n,T(α+β)=T(α)+T(β)
∀α,β∈Vn,T(α+β)=T(α)+T(β)
(2)
∀
α
∈
V
n
,
k
∈
R
,
T
(
k
α
)
=
k
T
(
α
)
∀ α\in V_n,k\in\R,T(kα)=kT(α)
∀α∈Vn,k∈R,T(kα)=kT(α)
特别的,从
V
n
V_n
Vn到自身的线性变换叫做
V
n
V_n
Vn中的线性变换。
实例:在线性空间
p
[
x
]
3
p[x]_3
p[x]3 中
任取
p
=
a
3
x
3
+
a
2
x
2
+
a
1
x
+
a
0
q
=
b
3
x
3
+
b
2
x
2
+
b
1
x
+
b
0
p=a_3x^3+a_2x^2+a_1x+a_0 \\ q=b_3x^3+b_2x^2+b_1x+b_0
p=a3x3+a2x2+a1x+a0q=b3x3+b2x2+b1x+b0
微分运算
D
D
D 是一个线性变换:
D
p
=
3
a
3
x
2
+
2
a
2
x
+
a
1
;
D
q
=
3
b
3
x
2
+
2
b
2
x
+
b
1
Dp=3a_3x^2+2a_2x+a_1;\ Dq=3b_3x^2+2b_2x+b_1
Dp=3a3x2+2a2x+a1; Dq=3b3x2+2b2x+b1
D
(
p
+
q
)
=
D
p
+
D
q
D
(
λ
p
)
=
λ
D
p
D(p+q)=Dp+Dq\\ D(λ p)=λ Dp
D(p+q)=Dp+DqD(λp)=λDp
线性变换的基本性质
(1)
T
(
Θ
)
=
Θ
,
T
(
−
α
)
=
−
T
(
α
)
T(Θ)=Θ, T(-α)=-T(α)
T(Θ)=Θ,T(−α)=−T(α)
(2) 若
β
=
k
1
α
1
+
k
2
α
2
+
⋯
+
k
m
α
m
β=k_1α_1+k_2α_2+\cdots+k_mα_m
β=k1α1+k2α2+⋯+kmαm,则
T
(
β
)
=
k
1
T
(
α
1
)
+
k
2
T
(
α
2
)
+
⋯
+
k
m
T
(
α
m
)
T(β)=k_1T(α_1)+k_2T(α_2)+\cdots+k_mT(α_m)
T(β)=k1T(α1)+k2T(α2)+⋯+kmT(αm)
(4) 线性变换
T
T
T 的像集
T
(
V
n
)
T(V_n)
T(Vn) 是一个线性空间,称为线性变换
T
T
T 的像空间(image space)
(5) 集合
{
α
∣
α
∈
V
n
,
T
(
α
)
=
Θ
}
\{α|α\in V_n,T(α)=Θ\}
{α∣α∈Vn,T(α)=Θ} 也是一个线性空间,称为线性变换
T
T
T 的核(kernel)
线性变换的矩阵表示:设线性空间
V
n
V_n
Vn的一组基为
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn,此基的像分别为
T
(
α
1
)
=
P
11
α
1
+
P
12
α
2
+
⋯
+
P
1
n
α
n
T
(
α
2
)
=
P
21
α
1
+
P
22
α
2
+
⋯
+
P
2
n
α
n
⋯
T
(
α
n
)
=
P
n
1
α
1
+
P
n
2
α
2
+
⋯
+
P
n
n
α
n
T(α_1)=P_{11}α_1+P_{12}α_2+\cdots+P_{1n}α_n \\ T(α_2)=P_{21}α_1+P_{22}α_2+\cdots+P_{2n}α_n \\ \cdots \\ T(α_n)=P_{n1}α_1+P_{n2}α_2+\cdots+P_{nn}α_n
T(α1)=P11α1+P12α2+⋯+P1nαnT(α2)=P21α1+P22α2+⋯+P2nαn⋯T(αn)=Pn1α1+Pn2α2+⋯+Pnnαn
即
(
T
(
α
1
)
,
T
(
α
2
)
,
⋯
,
T
(
α
n
)
)
=
(
α
1
,
α
2
,
⋯
,
α
n
)
P
(T(α_1),T(α_2),\cdots,T(α_n))=(\mathbf{α_1,α_2,\cdots,α_n})P
(T(α1),T(α2),⋯,T(αn))=(α1,α2,⋯,αn)P
此处的
P
=
(
P
11
P
12
⋯
P
1
n
P
21
P
22
⋯
p
2
n
⋮
⋮
⋱
⋮
p
n
1
p
n
2
⋯
p
n
n
)
P=\begin{pmatrix} P_{11}&P_{12}&\cdots&P_{1n} \\ P_{21}&P_{22}&\cdots&p_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ p_{n1}&p_{n2}&\cdots&p_{nn} \\ \end{pmatrix}
P=⎝⎜⎜⎜⎛P11P21⋮pn1P12P22⋮pn2⋯⋯⋱⋯P1np2n⋮pnn⎠⎟⎟⎟⎞
称为线性空间
V
n
V_n
Vn中线性变换
T
T
T在基
α
1
,
α
2
,
⋯
,
α
n
\mathbf{α_1,α_2,\cdots,α_n}
α1,α2,⋯,αn下的矩阵
同一线性变换在不同基下的矩阵的关系
定理 :设线性空间
V
n
V_n
Vn取定两个基
α
1
,
α
2
,
⋯
,
α
n
;
β
1
,
β
2
,
⋯
,
β
n
α_1,α_2,\cdots,α_n;β_1,β_2,\cdots,β_n
α1,α2,⋯,αn;β1,β2,⋯,βn ,且两个基有变换公式
(
β
1
,
β
2
,
⋯
,
β
n
)
=
(
α
1
,
α
2
,
⋯
,
α
n
)
P
(β_1,β_2,\cdots,β_n)=(α_1,α_2,\cdots,α_n)P
(β1,β2,⋯,βn)=(α1,α2,⋯,αn)P,
V
n
V_n
Vn 中的线性变换
T
T
T 在这两个基下的矩阵分别是
A
A
A 与
B
B
B,则
B
=
P
−
1
A
P
B=P^{-1}AP
B=P−1AP
秩的定义:线性变换
T
T
T 的像空间
T
(
V
n
)
T(V_n)
T(Vn) 的维数, 称为线性变换
T
T
T 的秩(rank)
(1) 若
A
A
A 是
T
T
T 的矩阵, 则
T
T
T 的秩就是
r
(
A
)
r(A)
r(A)
(2) 若
T
T
T 的秩为
r
r
r , 则
T
T
T 的核
N
T
N_T
NT 的维数为
n
−
r
n-r
n−r