向量的矩阵形式
n个有次序的数所组成的数组称为n元向量,这n个数称为该向量的n个分量
分量全是实数的向量称为实向量;分量为复数的向量是复向量;分量全为零的向量称为零向量,记作0,需要指明分量个数时记作0n
n元向量可以写成行向量或列向量的形式,二者相差一次转置运算,记为 a T ≠ a a^T \neq a aT=a
所有n元实向量的集合记作 R n R^n Rn
一般地,对所有没有指明的向量,都当作列向量,使用 e i ∈ R n e_i \in R^n ei∈Rn表示第i个分量是1,其余分量都为0的n元列向量。若干个同元数的列向量的集合叫做列向量组,若干个同元的行向量的集合叫做行向量组
向量是特殊的矩阵,一个向量组可组成一个矩阵;反之,一个矩阵又可以看作是由它的行向量组或列向量组构成的
用向量与矩阵相乘获得矩阵的某一行或某一列
e j = [ 0 0 ⋮ j ⋮ i ⋮ 0 ] e_j=\left[ \begin{array}{c} 0\\ 0\\ \vdots \\ j\\ \vdots \\ i\\ \vdots \\ 0\\ \end{array} \right] ej=⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎡00⋮j⋮i⋮0⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎤
则 A e j Ae_j Aej是A的第j列, e j A e_jA ejA不成立, e i T A e_i^TA eiTA是A的第i行
分块矩阵
若干个同元数的列向量的集合叫做列向量组,若干个同元数的行向量的集合叫做行向量组,对矩阵也可以进行类似的操作:用若干条纵贯整个矩阵的横线和竖线把矩阵A分成许多小块,每个小块都称为子矩阵,以这些子矩阵为元素的“形式上”的矩阵称为A的分块矩阵
A
=
[
λ
0
1
0
0
α
0
1
3
1
5
ψ
8
1
4
0
]
A=\left[ \begin{array}{cc|cc} \lambda & 0 & 1 & 0 \\ 0 & \alpha & 0 & 1 \\ \hline 3 & 1 & 5 & \psi \\ 8 & 1 & 4 & 0 \\ \end{array} \right]
A=⎣⎢⎢⎡λ0380α11105401ψ0⎦⎥⎥⎤
上面的A可以看作
A
=
[
T
B
C
D
]
A=\left[ \begin{array}{cc|cc} T & B\\ C & D\\ \end{array} \right]
A=[TCBD]
其中
T
=
[
λ
0
0
α
]
B
=
[
1
0
0
1
]
C
=
[
3
1
8
1
]
D
=
[
5
ψ
4
0
]
T=\left[ \begin{array}{cc|cc} \lambda & 0\\ 0 & \alpha \\ \end{array} \right]B=\left[ \begin{array}{cc|cc} 1 & 0\\ 0 & 1\\ \end{array} \right] C=\left[ \begin{array}{cc|cc} 3 & 1\\ 8 & 1\\ \end{array} \right]D=\left[ \begin{array}{cc|cc} 5 & \psi \\ 4 & 0\\ \end{array} \right]
T=[λ00α]B=[1001]C=[3811]D=[54ψ0]
常见的分块方式如下:
- 矩阵自己分成一块,即m*n的矩阵变成1*1的分块矩阵
- 按列分块: A = [ a 1 , a 2 , ⋯ , a n ] A=[a_1,a_2,\cdots,a_n] A=[a1,a2,⋯,an],其中an都是列向量
- 按行分块:和上面类似,每个子矩阵都是行向量
- 分成2*2的分块矩阵,其中左上角的子矩阵应该是一个方阵
- 分块对角矩阵、分块上三角矩阵、分块下三角矩阵等:看情况来,一般化为三角分块矩阵可以简化一些运算
分块矩阵运算
加减法
分块矩阵相加减,每个子矩阵都加减对应的子矩阵,如下所示
A
+
B
=
[
A
11
+
B
11
⋯
A
1
r
+
B
1
r
⋮
⋮
A
s
1
+
B
s
1
⋯
A
s
r
+
B
s
r
]
A+B=\left[ \begin{array}{cc} A_{11} +B_{11} & \cdots & A_{1r}+B_{1r} \\ \vdots & &\vdots\\ A_{s1}+B_{s1} & \cdots & A_{sr}+B_{sr}\\ \end{array} \right]
A+B=⎣⎢⎡A11+B11⋮As1+Bs1⋯⋯A1r+B1r⋮Asr+Bsr⎦⎥⎤
数乘
分块矩阵数乘k,每个子矩阵都数乘k,如下所示
k A = [ k A 11 ⋯ k A 1 r ⋮ ⋮ k A s 1 ⋯ k A s r ] kA=\left[ \begin{array}{cc} kA_{11} & \cdots & kA_{1r} \\ \vdots & &\vdots\\ kA_{s1} & \cdots & kA_{sr}\\ \end{array} \right] kA=⎣⎢⎡kA11⋮kAs1⋯⋯kA1r⋮kAsr⎦⎥⎤
矩阵乘法
当A为m*l矩阵,b为l*n矩阵时,对A的列和B的行采用相同的分块方法时,有以下矩阵乘法法则:
A
B
=
[
C
i
j
]
s
×
r
AB=[C_{ij}]_{s \times r}
AB=[Cij]s×r
其中,
C
i
j
=
∑
k
=
1
t
A
i
k
B
k
j
C_{ij}=\sum_{k=1}^t A_{ik}B_{kj}
Cij=∑k=1tAikBkj
要求:子矩阵Ai的列数必须等于子矩阵Bj的行数,Aik必须在Bkj的左侧,不能随意交换位置
转置
分块矩阵转置时,子矩阵的行位置变成列位置(子矩阵关于主对角线进行对称),且每个子矩阵都要进行转置
特殊规律
A = A E n = A [ e 1 , e 2 , ⋯ , e n ] = [ A e 1 , A e 2 , ⋯ , A e n ] A=AE_n=A[e_1,e_2,\cdots,e_n]=[Ae_1,Ae_2,\cdots,Ae_n] A=AEn=A[e1,e2,⋯,en]=[Ae1,Ae2,⋯,Aen]
可以用 e i T A e_i^TA eiTA表示A的第i行,用 A e j Ae_j Aej表示A的第j列,进一步可以用 e i T A e j e_i^TAe_j eiTAej表示A的(i,j)元aij
一个矩阵乘En就可以得到该矩阵的第n列
可逆矩阵
对于非0数a,存在其倒数,记作 a − 1 = 1 a a^{-1}=\frac{1}{a} a−1=a1且 a a − 1 = a − 1 a = 1 aa^{-1}=a^{-1}a=1 aa−1=a−1a=1,又称为逆数
对于矩阵也可以推广出类似的逆矩阵
可逆矩阵定义与性质
对于n阶方阵A,若存在n阶方阵B,使AB=BA=E,则A叫做可逆矩阵,B叫做A的逆矩阵
若不存在这样的B,则A不可逆
可逆矩阵及其逆矩阵都是方阵
若A可逆,则A的逆矩阵唯一,记作 A − 1 A^{-1} A−1
一般的矩阵乘法不满足消去律,但若某矩阵A可逆,则有 A X = A Y = > A − 1 A X = A − 1 A Y = > X Y AX=AY => A^{-1}AX=A^{-1}AY => XY AX=AY=>A−1AX=A−1AY=>XY,可以消去
推论
若方阵A和B满足AB=E,则AB都可逆,且 A − 1 = B , B − 1 = A A^{-1}=B,B^{-1}=A A−1=B,B−1=A
计算逆矩阵
伴随矩阵
矩阵A是n阶方阵,把由A的各个代数余子式组成的矩阵
A
∗
=
[
A
11
A
21
⋯
A
n
1
A
12
A
22
⋯
A
n
2
⋮
⋮
⋮
A
1
n
A
2
n
⋯
A
n
n
]
A^*= \left[\begin{matrix} A_{11} &A_{21}&\cdots&A_{n1}\\ A_{12} &A_{22}&\cdots&A_{n2}\\ \vdots &\vdots&&\vdots\\ A_{1n} &A_{2n}&\cdots&A_{nn}\\ \end{matrix}\right]
A∗=⎣⎢⎢⎢⎡A11A12⋮A1nA21A22⋮A2n⋯⋯⋯An1An2⋮Ann⎦⎥⎥⎥⎤
称为A的伴随矩阵
A*的第i列元素就是A中第i行相应元素的代数余子式,注意这里有一个转置的过程!
A*也是n阶方阵
矩阵可逆的充要条件
方阵A可逆的充要条件是 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0,
且当A可逆时, ∣ A − 1 ∣ = 1 ∣ A ∣ , A − 1 = A ∗ ∣ A ∣ |A^{-1}|=\frac{1}{|A|},A^{-1}=\frac{A^*}{|A|} ∣A−1∣=∣A∣1,A−1=∣A∣A∗
对于n阶方阵A,n>1,恒有 A A ∗ = A ∗ A = ∣ A ∣ E AA^*=A^*A=|A|E AA∗=A∗A=∣A∣E
|A|=0的矩阵是奇异矩阵;|A|不为0的矩阵是非奇异矩阵;非奇异矩阵和可逆矩阵是同一种矩阵
推论:伴随矩阵与原矩阵之间的关系
A A ∗ = ∣ A ∣ E AA^*=|A|E AA∗=∣A∣E
对这个式子的两边再取行列式
得到 ∣ A A ∗ ∣ = ∣ A ∣ n ∣ E ∣ |AA^*|=|A|^n|E| ∣AA∗∣=∣A∣n∣E∣
即 ∣ A ∣ ∣ A ∗ ∣ = ∣ A ∣ n |A||A^*|=|A|^n ∣A∣∣A∗∣=∣A∣n
于是 ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*|=|A|^{n-1} ∣A∗∣=∣A∣n−1
判断矩阵可逆并求解逆矩阵的步骤
- 算|A|
- 算A*
- 算|A-1|和A-1
- 结束
证明矩阵可逆的步骤
- 题中没有给多余条件:判断矩阵对应的行列式 ≠ 0 \neq0 =0
- 题中给了某些条件:用已知条件构造矩阵X另一矩阵=E
结论:若A为n阶方阵,则|A*|=|A|n-1
可逆矩阵的性质
若A为可逆矩阵,则:
- A − 1 A^{-1} A−1也可逆,且 ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A−1)−1=A
- A T A^T AT也可逆,且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)−1=(A−1)T
- 若数 k ≠ 0 k\neq0 k=0,则kA也可逆,且 ( k A ) − 1 = k − 1 A − 1 (kA)^{-1}=k^{-1}A^{-1} (kA)−1=k−1A−1
- 若A和B是同阶可逆矩阵,则AB也可逆,且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1
- 若A1,A2,…,Ak为同阶可逆矩阵,则A1A2…Ak也可逆,且 ( A 1 A 2 . . . A k ) − 1 = A 1 − 1 A 2 − 1 ⋯ A k − 1 (A_1A_2...A_k)^{-1}=A^{-1}_1A^{-1}_2\cdots A_k^{-1} (A1A2...Ak)−1=A1−1A2−1⋯Ak−1
- 若A可逆,Ak也可逆,且 ( A k ) − 1 = ( A − 1 ) k (A^k)^{-1}=(A^{-1})^k (Ak)−1=(A−1)k
- ( A + B ) − 1 = A − 1 + B − 1 (A+B)^{-1}=A^{-1}+B^{-1} (A+B)−1=A−1+B−1
初等行变换法求逆矩阵
前提定理
三种初等矩阵都是可逆矩阵,且其逆矩阵还是同类型的初等矩阵
方阵A可逆的充要条件是A能表示成有限个初等矩阵的乘积
可逆矩阵的等价标准形是单位矩阵
方阵A可逆的充要条件是A与E等价——在矩阵A的左/右端乘可逆矩阵等价于对A进行有限次初等行/列变换
mxn矩阵A与B等价的充要条件是存在m阶可逆矩阵P和n阶可逆矩阵Q,使PAQ=B
初等行变换法
根据上述定理,只要能用初等行变换把[A,E]化为[E,B]的形式,B一定是A的逆
一般来说初等行变换求逆矩阵比用伴随矩阵求逆矩阵更方便
推论
[ A C O B ] − 1 = [ A − 1 − A − 1 C B − 1 O B − 1 ] \left[ \begin{array}{cc|cc} A & C\\ O & B\\ \end{array} \right]^{-1}= \left[ \begin{array}{cc|cc} A^{-1} & -A^{-1}CB^{-1}\\ O & B^{-1}\\ \end{array} \right] [AOCB]−1=[A−1O−A−1CB−1B−1]
[ A O O B ] − 1 = [ A − 1 O O B − 1 ] \left[ \begin{array}{cc|cc} A & O\\ O & B\\ \end{array} \right]^{-1}=\left[ \begin{array}{cc|cc} A^{-1} & O\\ O & B^{-1}\\ \end{array} \right] [AOOB]−1=[A−1OOB−1]
[ A O C B ] − 1 = [ A − 1 O − B − 1 C A − 1 B − 1 ] \left[ \begin{array}{cc|cc} A & O\\ C & B\\ \end{array} \right]^{-1}=\left[ \begin{array}{cc|cc} A^{-1} & O\\ -B^{-1}CA^{-1} & B^{-1}\\ \end{array} \right] [ACOB]−1=[A−1−B−1CA−1OB−1]
矩阵方程
矩阵方程的一般形式为AX=C,YB=C和AZB=C,其中A和B可逆,可以求出他们的解为X=A-1C、Y=CB-1、Z=A-1CB-1,也就是求出A-1和B-1就能求出方程的解。若方程不能整理成这三种形式之一,或A、B不可逆,那么需要转化为方程组的形式进行求解。对于这三种形式的方程,可以使用初等行变换求解,步骤如下:
-
检查 ∣ A ∣ ≠ 0 |A|\neq 0 ∣A∣=0和 ∣ B ∣ ≠ 0 |B|\neq0 ∣B∣=0
-
将方程转换成标准的三种形式之一
-
将方程联立得
$$
[A,C]对应AX=C\
\left[\begin{matrix}
B\
C
\end{matrix}\right]对应YB=C
$$
将整体矩阵的左边/上边变换为单位矩阵,右边/下边就是待求矩阵
- 仅使用初等行变换将原矩阵变换为以下形式:
[ E , X ] [ E Y ] [E,X]\\ \left[\begin{matrix} E\\ Y \end{matrix}\right] [E,X][EY]
向量空间与向量正交性
设V是n元向量的集合,如果V非空,且对于向量的线性运算封闭(即 ∀ v 1 ∈ V , v 2 ∈ V , k ∈ R \forall v_1 \in V,v_2 \in V,k \in R ∀v1∈V,v2∈V,k∈R,都有 v 1 + v 2 ∈ V , k v 1 ∈ V v_1+v_2 \in V,kv_1 \in V v1+v2∈V,kv1∈V),则称V是一个向量空间
向量空间
形成向量空间的条件:
- V非空:V中至少含有零向量
- 组成向量满足可加性: ∀ v 1 ∈ V , v 2 ∈ V \forall v_1 \in V,v_2 \in V ∀v1∈V,v2∈V,都有 v 1 + v 2 ∈ V v_1+v_2 \in V v1+v2∈V
- 组成向量满足齐次性: ∀ v ∈ V , k ∈ R \forall v \in V,k \in R ∀v∈V,k∈R都有 k v ∈ V kv \in V kv∈V
解空间:齐次线性方程组Ax=0的所有解向量构成的集合S是一个向量空间,把它叫做这个齐次线性方程组的解空间
解空间实际上是解集的另一种表述
向量空间的特征
只含有零向量的集合 V = { 0 } V=\{0\} V={0}是一个向量空间
所有n元实向量的集合 R n R^n Rn是一个向量空间
若V是一个向量空间,它一定含有零向量
非齐次线性方程组的解集不是向量空间,所以非齐次线性方程组没有解空间
集合 V = { v = [ x , y ] T ∣ x , y ∈ R 且 x y = 0 } V=\{v=[x,y]^T | x,y \in R且xy=0\} V={v=[x,y]T∣x,y∈R且xy=0}不是向量空间
若V1和V2是两个向量空间, V 1 ⊆ V 2 V_1 \subseteq V_2 V1⊆V2,则称V1是V2的子空间; V 1 ⊆ V 2 V_1 \subseteq V_2 V1⊆V2且 V 1 ⊇ V 2 V_1 \supseteq V_2 V1⊇V2,则称这两个向量空间相等,记作V1=V2
生成向量空间
a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am是m个已知的n元向量,则集合 V = { v = ∑ j = 1 m x j a j ∣ x 1 , x 2 , ⋯ , x m ∈ R } V=\{v=\sum_{j=1}^m x_j a_j | x_1,x_2,\cdots,x_m \in R\} V={v=∑j=1mxjaj∣x1,x2,⋯,xm∈R}是一个向量空间,把它叫做由向量 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am生成的向量空间,记作 V = s p a n { a 1 , a 2 , ⋯ , a m } V=span\{a_1,a_2,\cdots,a_m\} V=span{a1,a2,⋯,am}
向量空间的属性
基:向量空间V的一个极大无关组叫做V的一个基
维数:向量空间V的秩叫做V的维数,记作dim(V),若dim(V)=r,则称V是r维向量空间
若已知r维向量空间V的基为 v 1 , v 2 , ⋯ , v r v_1,v_2,\cdots,v_r v1,v2,⋯,vr,则向量空间V可以表示成 V = { v = x 1 v 1 + x 2 v 2 + ⋯ + x r v r ∣ x 1 , x 2 , ⋯ , x r ∈ R } V=\{v=x_1v_1+x_2v_2+\cdots+x_rv_r | x_1,x_2,\cdots,x_r \in R\} V={v=x1v1+x2v2+⋯+xrvr∣x1,x2,⋯,xr∈R}的形式。也就是说可以用V的基作为代表对V进行研究,其对应系数就是 x i x_i xi
向量空间中的向量总能用这个向量空间的基来表示
设V是n维向量空间,有m<n,则V中任一线性无关的向量组 v 1 , v 2 , ⋯ , v m v_1,v_2,\cdots,v_m v1,v2,⋯,vm都能扩充成V的一个基
设 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a1,a2,⋯,an是n维向量空间V中的一个基,对任意向量 b ∈ V b \in V b∈V,把满足 b = x 1 a 1 + x 2 a 2 + ⋯ + x n a n b=x_1a_1+x_2a_2+\cdots+x_na_n b=x1a1+x2a2+⋯+xnan的有序数 x 1 , x 2 , ⋯ , x r x_1,x_2,\cdots,x_r x1,x2,⋯,xr叫做向量b在这个基下的坐标; x = [ x 1 , x 2 , ⋯ , x n ] T x=[x_1,x_2,\cdots,x_n]^T x=[x1,x2,⋯,xn]T叫做向量b在这个基下的坐标向量
易知,求向量在基下的坐标就是求解一个线性方程组,反之亦然
基变换
向量空间中的基之间都能互相进行线性表示,因此存在变换关系
基变换:将向量空间V中的基通过某种方法变换为另一个基的过程
在基变换过程中一般通过矩阵乘法进行操作,所使用的n阶方阵P称为从旧基到新基的过渡矩阵
任意过渡矩阵P是可逆矩阵
坐标变换
使用基变换后向量空间的坐标往往也会变化,它们两者的关系如下所示:
P是基变换的过渡矩阵,它的逆矩阵是P-1
则基变换为: [ b 1 , b 2 , ⋯ , b n ] = [ a 1 , a 2 , ⋯ , a n ] P [b_1,b_2,\cdots,b_n]=[a_1,a_2,\cdots,a_n]P [b1,b2,⋯,bn]=[a1,a2,⋯,an]P
可以简记为: B = A P B=AP B=AP,可将P看作方程 B = A x B=Ax B=Ax的解
对应坐标变换为: x = P y x=Py x=Py或 y = P − 1 x y=P^{-1}x y=P−1x
可将y看作方程 x = P y x=Py x=Py的解或可将x看作方程 y = P − 1 x y=P^{-1}x y=P−1x的解
通过以上两公式即可计算基变换和坐标变换
向量的正交性
向量内积
向量内积就是推广的二维向量点积
设 a = [ a 1 , a 2 , ⋯ , a n ] T a=[a_1,a_2,\cdots,a_n]^T a=[a1,a2,⋯,an]T, b = [ b 1 , b 2 , ⋯ , b n ] T b=[b_1,b_2,\cdots,b_n]^T b=[b1,b2,⋯,bn]T是两个实向量,a与b的内积记作(a,b),规定 ( a , b ) = a 1 b 1 + a 2 b 2 + ⋯ + a n b n = ∑ i n a i b i (a,b)=a_1b_1+a_2b_2+\cdots+a_nb_n=\sum_i^n a_ib_i (a,b)=a1b1+a2b2+⋯+anbn=∑inaibi
可以用矩阵运算表示内积 ( a , b ) = a T b (a,b)=a^Tb (a,b)=aTb
内积公理:
- 交换律: ( a , b ) = ( b , a ) (a,b)=(b,a) (a,b)=(b,a)
- 结合律: ( k a , b ) = k ( a , b ) (ka,b)=k(a,b) (ka,b)=k(a,b)
- 分配律: ( a + b , c ) = ( a , c ) + ( b , c ) (a+b,c)=(a,c)+(b,c) (a+b,c)=(a,c)+(b,c)
- 消去律: ( a , a ) ≥ 0 (a,a)\ge 0 (a,a)≥0且 ( a , a ) = 0 (a,a)=0 (a,a)=0 ⇔ \Leftrightarrow ⇔ a = 0 a=0 a=0
其中 a , b , c ∈ R n , k 为 任 意 实 数 a,b,c \in R^n,k为任意实数 a,b,c∈Rn,k为任意实数
向量内积的应用
欧氏空间:定义了内积的向量空间
在欧氏空间中,可以引入长度、角度的概念
实向量 a = [ a 1 , a 2 , ⋯ , a n ] T a=[a_1,a_2,\cdots,a_n]^T a=[a1,a2,⋯,an]T的长度(又叫做范数)记作 ∣ ∣ a ∣ ∣ ||a|| ∣∣a∣∣,有 ∣ ∣ a ∣ ∣ = ( a , a ) = ( a 1 ) 2 + ( a 2 ) 2 + ⋯ + ( a n ) 2 ||a||=\sqrt{(a,a)}=\sqrt{(a_1)^2+(a_2)^2+\cdots+(a_n)^2} ∣∣a∣∣=(a,a)=(a1)2+(a2)2+⋯+(an)2
向量长度具有以下性质:
- 非负性: ∣ ∣ a ∣ ∣ > 0 且 ∣ ∣ a ∣ ∣ = 0 ⇔ a = 0 ||a||>0且||a||=0 \Leftrightarrow a=0 ∣∣a∣∣>0且∣∣a∣∣=0⇔a=0
- 齐次性: ∣ ∣ k a ∣ ∣ = ∣ k ∣ ⋅ ∣ ∣ a ∣ ∣ ||ka||=|k|\cdot||a|| ∣∣ka∣∣=∣k∣⋅∣∣a∣∣
- 三角不等式: ∣ ∣ a + b ∣ ∣ ≤ ∣ ∣ a ∣ ∣ + ∣ ∣ b ∣ ∣ ||a+b||\le ||a||+||b|| ∣∣a+b∣∣≤∣∣a∣∣+∣∣b∣∣
- 柯西-施瓦茨不等式: ∣ ( a , b ) ∣ ≤ ∣ ∣ a ∣ ∣ ⋅ ∣ ∣ b ∣ ∣ |(a,b)|\le||a||\cdot||b|| ∣(a,b)∣≤∣∣a∣∣⋅∣∣b∣∣
当 ∣ ∣ a ∣ ∣ = 1 ||a||=1 ∣∣a∣∣=1时,称a为单位向量;对非零向量a,称 a ∣ ∣ a ∣ ∣ \frac{a}{||a||} ∣∣a∣∣a为a的单位化向量
特别地, a T a = ∣ ∣ a ∣ ∣ 2 a^Ta=||a||^2 aTa=∣∣a∣∣2
定义 a ≠ 0 , b ≠ 0 时 , θ = a r c c o s ( a , b ) ∣ ∣ a ∣ ∣ ⋅ ∣ ∣ b ∣ ∣ a\neq0,b\neq0时,\theta=arccos\frac{(a,b)}{||a||\cdot||b||} a=0,b=0时,θ=arccos∣∣a∣∣⋅∣∣b∣∣(a,b)为向量a与b的夹角
当 ( a , b ) = 0 (a,b)=0 (a,b)=0即 a T b = 0 a^Tb=0 aTb=0时,称向量a与b正交(“垂直”)
零向量与任何与其同源的向量正交(注意不是“任何向量”)
正交向量组
正交向量组:由两两正交的非零向量组成的向量组
标准正交向量组:由单位向量组成的正交向量组
核心性质:正交向量组一定线性无关,线性无关的向量组不一定正交
使用施密特正交化方法从一个线性无关的向量组求出一个与其等价的正交向量组
设
a
1
,
a
2
,
⋯
,
a
m
a_1,a_2,\cdots,a_m
a1,a2,⋯,am是一个线性无关的向量组,令
KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
这个公式可以直观展开为:
KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
可得到与
a
1
,
a
2
,
⋯
,
a
m
a_1,a_2,\cdots,a_m
a1,a2,⋯,am等价的正交向量组
b
1
,
b
2
,
⋯
,
b
m
b_1,b_2,\cdots,b_m
b1,b2,⋯,bm
再将 b 1 , b 2 , ⋯ , b m b_1,b_2,\cdots,b_m b1,b2,⋯,bm单位化以后即可得到与 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am等价的标准正交向量组
单位化的基本方法就是令 η i = b i ∣ ∣ b i ∣ ∣ \eta_i=\frac{b_i}{||b_i||} ηi=∣∣bi∣∣bi
正交基:当欧氏空间V的一个基为正交向量组时,称这个基为V的正交基
标准正交基:当欧氏空间V的一个基为标准正交向量组时,称这个基为V的标准正交基
正交矩阵
正交矩阵:满足 A T A = E A^TA=E ATA=E的实方阵
注意:A为实方阵时,有 A T A = E ⇔ A − 1 = A T ⇔ A A T = E A^TA=E \Leftrightarrow A^{-1}=A^T \Leftrightarrow AA^T=E ATA=E⇔A−1=AT⇔AAT=E,三者之一就可以作为正交矩阵的定义
同阶正交矩阵A、B有以下性质:
- A可逆,且 A − 1 = A T A^{-1}=A^T A−1=AT
- A T 、 A − 1 A^T、A^{-1} AT、A−1为正交矩阵
- 行列式 ∣ A ∣ = ± 1 |A|=\pm 1 ∣A∣=±1
- AB为正交矩阵
正交矩阵的两个判断条件:
- 满足定义
- 实方阵A为正交矩阵的充要条件是A的列向量组为标准正交向量组
矩阵和向量
下面的内容是关于矩阵和向量之间关系的总结复习
推荐学完线代基础知识后再看
向量组的线性相关性
线性组合:有m个n维向量 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm及m个数 k 1 , k 2 , ⋯ , k m k_1,k_2,\cdots,k_m k1,k2,⋯,km,则向量 k 1 α 1 + k 2 α 2 + ⋯ + k m α m k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m k1α1+k2α2+⋯+kmαm称为向量组 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm的线性组合
线性表出:若向量β能表示成一个向量组的线性组合,则称β能被此向量组线性表出(这里的线性表出就代表之前所说的线性表示)
线性相关:对m个n维向量 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm,若存在一组不全为0的数 k 1 , k 2 , ⋯ , k m k_1,k_2,\cdots,k_m k1,k2,⋯,km使线性组合 k 1 α 1 + k 2 α 2 + ⋯ + k m α m = 0 k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m=0 k1α1+k2α2+⋯+kmαm=0,则称向量组 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm线性相关
线性无关:若不存在不全为0的数 k 1 , k 2 , ⋯ , k m k_1,k_2,\cdots,k_m k1,k2,⋯,km使线性组合 k 1 α 1 + k 2 α 2 + ⋯ + k m α m = 0 k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m=0 k1α1+k2α2+⋯+kmαm=0,则称向量组 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm线性无相关
线性无关的另一表述:当且仅当 k 1 = k 2 = ⋯ = k m = 0 k_1=k_2=\cdots=k_m=0 k1=k2=⋯=km=0时,才有 k 1 α 1 + k 2 α 2 + ⋯ + k m α m = 0 k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m=0 k1α1+k2α2+⋯+kmαm=0,则称向量组 α 1 , α 2 , ⋯ , α m \alpha_1,\alpha_2,\cdots,\alpha_m α1,α2,⋯,αm线性无相关
对于单个非零向量,两个不成比例的向量均线性无关
向量组要不线性相关要不线性无关
判别线性相关性
记向量组 A = [ α 1 , α 2 , ⋯ , α s ] A=[\alpha_1,\alpha_2,\cdots,\alpha_s] A=[α1,α2,⋯,αs]
使用下面的五个定理判定线性相关性:
-
向量β能够被A线性表出 等价于 非齐次线性方程组Ax=β有解 等价于 r ( A ) = r ( [ A , β ] ) r(A)= r([A,\beta]) r(A)=r([A,β])
反之,
不能线性表出 等价于 Ax=β无解 等价于 r ( A ) ≠ r ( [ A , β ] ) r(A)\neq r([A,\beta]) r(A)=r([A,β])
-
向量组A线性相关 等价于 齐次线性方程组Ax=0有非零解 等价于 A的列秩<A的列数s
反之,
线性无关 等价于 齐次线性方程组Ax=0只有零解 等价于 A的列秩=A的列数s
-
特别对于A为n个n维列向量组成的向量组(A是方阵)的情况,
A线性相关 等价于 ∣ A ∣ = ∣ α 1 , α 2 , ⋯ , α n ∣ = 0 |A|=|\alpha_1,\alpha_2,\cdots,\alpha_n|=0 ∣A∣=∣α1,α2,⋯,αn∣=0 等价于 Ax=0有非零解
反之,
A线性无关 等价于 ∣ A ∣ ≠ 0 |A|\neq0 ∣A∣=0 等价于 Ax=0仅有零解
-
n+1个n维列向量,因为 r ( α 1 , α 2 , ⋯ , α n , α n + 1 ≤ n ≤ n + 1 ) r(\alpha_1,\alpha_2,\cdots,\alpha_n,\alpha_{n+1}\le n\le n+1) r(α1,α2,⋯,αn,αn+1≤n≤n+1),所以 [ α 1 , α 2 , ⋯ , α n + 1 ] x = 0 [\alpha_1,\alpha_2,\cdots,\alpha_{n+1}]x=0 [α1,α2,⋯,αn+1]x=0必有非零解可以推出 α 1 , α 2 , ⋯ , α n , α n + 1 \alpha_1,\alpha_2,\cdots,\alpha_n,\alpha_{n+1} α1,α2,⋯,αn,αn+1必线性相关
-
α 1 , α 2 , ⋯ , α r \alpha_1,\alpha_2,\cdots,\alpha_r α1,α2,⋯,αr线性相关 ⇔ \Leftrightarrow ⇔ [ α 1 , α 2 , ⋯ , α n + 1 ] x = 0 [\alpha_1,\alpha_2,\cdots,\alpha_{n+1}]x=0 [α1,α2,⋯,αn+1]x=0有非零解 ⇒ \Rightarrow ⇒ [ α 1 , α 2 , ⋯ , α r , ⋯ , α s ] y = 0 [\alpha_1,\alpha_2,\cdots,\alpha_r,\cdots,\alpha_s]y=0 [α1,α2,⋯,αr,⋯,αs]y=0必有非零解,即 α 1 , α 2 , ⋯ , α r , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_r,\cdots,\alpha_s α1,α2,⋯,αr,⋯,αs线性相关
这个规律可以总结为:部分相关能推出整体相关反之,有 α 1 , α 2 , ⋯ , α r , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_r,\cdots,\alpha_s α1,α2,⋯,αr,⋯,αs线性无关 ⇒ \Rightarrow ⇒ α 1 , α 2 , ⋯ , α r \alpha_1,\alpha_2,\cdots,\alpha_r α1,α2,⋯,αr线性无关
这个规律可以总结为:整体线性无关 ⇒ \Rightarrow ⇒ 任何部分线性无关
-
α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs线性无关 ⇔ \Leftrightarrow ⇔ [ α 1 , α 2 , ⋯ , α s ] x = 0 [\alpha_1,\alpha_2,\cdots,\alpha_s]x=0 [α1,α2,⋯,αs]x=0只有零解 ⇒ \Rightarrow ⇒ 其延伸组也线性无关
这个规律可以总结为延伸组线性相关 ⇒ \Rightarrow ⇒ 原向量组线性相关
-
-
向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s\ge2) α1,α2,⋯,αs(s≥2)线性相关的充要条件是向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s\ge2) α1,α2,⋯,αs(s≥2)中至少有一个向量可以由其余s-1给向量线性表出
反之,向量组线性无关的充要条件就是其中任意向量都不能由其他的s-1个向量线性表出 -
若向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s\ge2) α1,α2,⋯,αs(s≥2)线性无关,而向量组 α 1 , α 2 , ⋯ , α s , β ( s ≥ 2 ) \alpha_1,\alpha_2,\cdots,\alpha_s,\beta(s\ge2) α1,α2,⋯,αs,β(s≥2)线性相关,则 β \beta β可以由 α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s\ge2) α1,α2,⋯,αs(s≥2)线性表出,且表出方法唯一
-
若向量组 β 1 , β 2 , ⋯ , β s \beta_1,\beta_2,\cdots,\beta_s β1,β2,⋯,βs中的每个向量 β i ( i = 1 , 2 , ⋯ , s ) \beta_i(i=1,2,\cdots,s) βi(i=1,2,⋯,s)都可由向量组 α 1 , α 2 , ⋯ , α t \alpha_1,\alpha_2,\cdots,\alpha_t α1,α2,⋯,αt线性表出,且有s>t,则向量组 β 1 , β 2 , ⋯ , β s \beta_1,\beta_2,\cdots,\beta_s β1,β2,⋯,βs线性相关
可以这样总结这个理论:
以少表多,则多的相关
同理有逆定理:
若 β 1 , β 2 , ⋯ , β s \beta_1,\beta_2,\cdots,\beta_s β1,β2,⋯,βs中的每个向量 β i \beta_i βi都能由 α 1 , α 2 , ⋯ , α t \alpha_1,\alpha_2,\cdots,\alpha_t α1,α2,⋯,αt线性表出,且向量组 β 1 , β 2 , ⋯ , β s \beta_1,\beta_2,\cdots,\beta_s β1,β2,⋯,βs线性无关,则 s ≤ t s\le t s≤t
向量组之间的关系
极大线性无关组:满足以下条件的向量组
- 极大线性无关组与其他向量组成的向量组中其他向量都可以由极大线性无关组线性表出
- 极大线性无关组中的任何向量线性无关
极大线性无关组就是向量组中“最大”的具有线性无关特征的向量组
向量组的极大线性无关组一般不唯一
只有零向量组成的向量组不存在极大线性无关组
线性无关向量组的极大线性无关组就是他本身
等价向量组:两个向量组中的向量可以互相线性表出,则这两个向量组是等价向量组
等价向量组满足以下特征:
- 一个向量组和它本身是等价的
- 向量组A和B等价,则B和A等价
- 向量组A和B等价,B和C等价,则A和C等价
向量组和他的极大线性无关组是等价向量组
注意:等价矩阵和等价向量组不一样
等价矩阵是指形式上通过等价变换的两个矩阵,等价向量组则是指两个向量组可以互相线性表示
矩阵等价要同型,行数、列数都要相等
向量组等价要同维,但向量个数可以不等
向量与矩阵的秩
向量组的秩:向量组的极大线性无关组中所含向量的个数称为向量组的秩
等价向量组等秩,但等秩向量不一定是等价的
三秩相等定理
矩阵的秩r(A)=A的行向量组的秩(A的行秩)=A的列向量组的秩(A的列秩)
若矩阵A通过初等行变换能变成矩阵B,则有如下结论:
- A的行向量组和B的行向量组是等价向量组
- A和B的任何相应的部分列向量组具有相同的线性相关性
向量组秩不等式
若向量组B中的向量均可由向量组A线性表出,则有 r ( B ) ≤ r ( A ) r(B)\le r(A) r(B)≤r(A)
向量的特殊特征
-
内积
( α , β ) = α T β (\alpha,\beta)=\alpha^T \beta (α,β)=αTβ称为向量组 α \alpha α和 β \beta β的内积
-
正交向量
当两向量内积等于0,即 α T β = 0 \alpha^T \beta=0 αTβ=0时,称两向量正交
-
模
∣ ∣ α ∣ ∣ = ∑ i = 1 n a i 2 ||\alpha||=\sqrt{\sum_{i=1}^n a_i^2} ∣∣α∣∣=∑i=1nai2称为向量的模
-
标准正交向量组
若列向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs满足
KaTeX parse error: No such environment: equation at position 28: …\alpha_j=\begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
则称向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs为标准正交向量组使用施密特正交化方法将一个向量组变换成与它等价的标准正交向量组
-
施密特正交化方法(之前有写到,但是还是再来看一遍)
设 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am是一个线性无关的向量组,令
KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
这个公式可以直观展开为:
KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
可得到与 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am等价的正交向量组 b 1 , b 2 , ⋯ , b m b_1,b_2,\cdots,b_m b1,b2,⋯,bm再将 b 1 , b 2 , ⋯ , b m b_1,b_2,\cdots,b_m b1,b2,⋯,bm单位化以后即可得到与 a 1 , a 2 , ⋯ , a m a_1,a_2,\cdots,a_m a1,a2,⋯,am等价的标准正交向量组
单位化的基本方法就是令 η i = b i ∣ ∣ b i ∣ ∣ \eta_i=\frac{b_i}{||b_i||} ηi=∣∣bi∣∣bi
考试中一般只展开到 β 3 \beta_3 β3
即有
KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \begi…
单位化实际上就是用向量除以他自己的模(也就是所有向量元素的平方和开根号) -
正交矩阵
由正交向量组可以得到类似的正交矩阵
A为n阶方阵,满足 A T A = E A^TA=E ATA=E则称A时正交矩阵
对于正交矩阵A,下列命题互为充要条件:
- A是正交矩阵
- A T A = E A^TA=E ATA=E
- A T = A − 1 A^T=A^{-1} AT=A−1
- A的行(列)向量组是标准正交向量组
称对正交矩阵A进行的变换Y=AX为正交变换
正交变换保证向量的内积不变——即保持向量的长度、两向量间夹角不变