整理:Peter1146717850
一、向量与线性组合
向量:往什么方向走多么远
e.g. ( 1 2 ) \begin{pmatrix} 1 \\ 2\end{pmatrix} (12)
向量的模:向量的长度
向量的加减法:向量对应元素相加减(前提:维度相同)
( a b c ) + ( x y z ) = ( a + x b + y c + z ) \begin{pmatrix} a \\b \\ c\end{pmatrix} + \begin{pmatrix} x \\y \\ z\end{pmatrix} = \begin{pmatrix} a+x \\b+y\\c+z\end{pmatrix} abc + xyz = a+xb+yc+z ,减法同理
向量的加法是首尾相连,减法是尾尾相连。
向量点乘(内积):对应元素相乘后相加
a ⋅ b = a 1 b 1 + a 2 b 2 + ⋯ + a n b n , a = ( a 1 a 2 ⋮ a n ) , b = ( b 1 b 2 ⋮ b n ) . a·b=a_1b_1+a_2b_2+\dots+a_nb_n, a=\begin{pmatrix} a_1\\a_2\\\vdots\\a_n\end{pmatrix},b=\begin{pmatrix} b_1 \\b_2\\\vdots\\b_n\end{pmatrix}. a⋅b=a1b1+a2b2+⋯+anbn,a= a1a2⋮an ,b= b1b2⋮bn .
点乘大于0,夹角为锐角;点乘为0,两向量正交(垂直);点乘大于0,夹角为钝角。
向量叉乘(外积):对于 a = ( a 1 , a 2 , a 3 ) a=(a_1, a_2, a_3) a=(a1,a2,a3), b = ( b 1 , b 2 , b 3 ) b=(b_1, b_2, b_3) b=(b1,b2,b3)
a × b = ∣ i j k a 1 a 2 a 3 b 1 b 2 b 3 ∣ = ( a 2 b 3 − a 3 b 2 ) i − ( a 1 b 3 − a 3 b 1 ) j + ( a 1 b 2 − a 2 b 1 ) k a×b=\begin{vmatrix} i & j & k\\ a_1 & a_2 & a_3\\ b_1 & b_2 &b_3\end{vmatrix}=(a_2b_3-a_3b_2)i-(a_1b_3-a_3b_1)j+(a_1b_2-a_2b_1)k a×b= ia1b1ja2b2ka3b3 =(a2b3−a3b2)i−(a1b3−a3b1)j+(a1b2−a2b1)k
叉乘的结果遵循右手定则。(对于一般的右手坐标系,如果是x与y的叉乘,结果将指向z轴)
向量与常数相乘:向量拉伸或压缩。
单位向量: 1 ∣ ∣ v ∣ ∣ v \frac{1}{||v||}v ∣∣v∣∣1v
线性组合: c 1 , c 2 , … , c k c_1, c_2, \dots, c_k c1,c2,…,ck为常数, v 1 , v 2 , … , v k v_1, v_2, \dots, v_k v1,v2,…,vk为 R n R^n Rn中的向量, c 1 v 1 + c 2 v 2 + ⋯ + c k v k c_1v_1+c_2v_2+\dots+c_kv_k c1v1+c2v2+⋯+ckvk为向量组的线性组合。线性表示就是用线性组合来表示。
线性无关和线性相关:线性无关-n个向量组成的向量组的线性组合只在系数为零时为零;线性相关-存在不全为零的系数时线性组合也为零。
e.g. 向量 ( 1 2 ) \begin{pmatrix} 1 \\2\end{pmatrix} (12)和向量 ( − 1 2 ) \begin{pmatrix} -1 \\2\end{pmatrix} (−12)是线性无关的,而向量 ( 1 2 ) \begin{pmatrix} 1 \\2\end{pmatrix} (12)和向量 ( 2 4 ) \begin{pmatrix} 2 \\4\end{pmatrix} (24)是线性相关的。
【理解】向量 ( 1 2 ) \begin{pmatrix} 1 \\2\end{pmatrix} (12)和向量 ( 2 4 ) \begin{pmatrix} 2 \\4\end{pmatrix} (24)在一条直线上,无法线性表示整个二维平面中的所有向量。可同理拓展至多维。
在几何上:
- 线性相关:这组向量里有多余的向量,把它去掉以后也不影响原有的张成空间
- 线性无关:没有多余的向量,去掉任何一个都会影响原有的张成空间,每一个向量都代表了一个新的维度
⭐向量组的秩:该向量组可以张成的空间的维度,用r来表示。
向量组里有多少个线性无关的向量,那么这个向量组的秩就是多少。
二、矩阵与线性变换
标准正交基:两两垂直,长度为1的基(xyz: i ^ j ^ k ^ \hat{i}\hat{j}\hat{k} i^j^k^)
矩阵:一个m行n列的数表
( a 11 a 12 … a 1 n a 21 a 22 … a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 … a m n ) \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n}\\ a_{21} & a_{22} & \dots & a_{2n}\\ \vdots & \vdots & \ddots &\vdots \\ a_{m1} & a_{m2} & \dots &a_{mn} \end{pmatrix} a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn
- 行矩阵(行向量):只有一行的矩阵
- 列矩阵(列向量):只有一列的矩阵
- 方块矩阵(方阵):n行n列的矩阵
每个线性变换都可以由一个矩阵表示。
e.g. A = [ 1 − 1 1 0 ] A=\begin{bmatrix} 1 & -1\\ 1 &0 \end{bmatrix} A=[11−10]是把基 ( 1 0 ) \begin{pmatrix} 1 \\ 0 \end{pmatrix} (10) ( 0 1 ) \begin{pmatrix} 0 \\ 1 \end{pmatrix} (01)变换成 ( 1 1 ) \begin{pmatrix} 1 \\ 1 \end{pmatrix} (11) ( − 1 0 ) \begin{pmatrix} -1 \\ 0 \end{pmatrix} (−10)的线性变换。
矩阵向量乘法:向量的变换,把矩阵所描述的线性变换作用于这个向量上。
[ a b c d ] [ x y ] = x [ a c ] + y [ b d ] = [ a x + b y c x + d y ] \begin{bmatrix} a &b \\ c&d \end{bmatrix}\begin{bmatrix} x \\ y \end{bmatrix}=x\begin{bmatrix} a \\ c \end{bmatrix}+y\begin{bmatrix} b \\ d \end{bmatrix}=\begin{bmatrix} ax+by \\ cx+dy \end{bmatrix} [acbd][xy]=x[ac]+y[bd]=[ax+bycx+dy]
矩阵乘法:行乘列(⭐注意:一般情况下, A B ≠ B A AB\ne BA AB=BA)
逆矩阵:当 A B = B A = E AB=BA=E AB=BA=E,其中矩阵B就是矩阵A的逆矩阵,用 A − 1 A^{-1} A−1表示。
⭐注意:若A, B都可逆,则 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)−1=B−1A−1.
单位矩阵: E = I = ( 1 0 … 0 0 1 … 0 ⋮ ⋮ ⋱ ⋮ 0 0 … 1 ) E=I=\begin{pmatrix} 1&0&\dots&0 \\ 0&1&\dots&0\\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \dots & 1\end{pmatrix} E=I= 10⋮001⋮0……⋱…00⋮1
⭐二阶矩阵的逆矩阵:若 A = [ a b c d ] A=\begin{bmatrix} a &b\\ c&d \end{bmatrix} A=[acbd], A − 1 = 1 a d − b c [ d − b − c a ] A^{-1}=\frac{1}{ad-bc}\begin{bmatrix} d&-b \\ -c&a \end{bmatrix} A−1=ad−bc1[d−c−ba].
矩阵转置:把矩阵的行和列交换产生的矩阵是转置矩阵,记作 A T A^T AT.
⭐注意: ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT
三、行列式
行列式:设 A = [ a b c d ] A=\begin{bmatrix} a &b\\ c&d \end{bmatrix} A=[acbd],A的行列式记作|A|,D,det或者 ∣ a b c d ∣ \begin{vmatrix} a &b\\ c&d \end{vmatrix} acbd .
∣ A ∣ = a d − b c |A|=ad-bc ∣A∣=ad−bc
行列式计算:
- 拉普拉斯法则
- 萨卢斯法则
行列式的几何意义:
- 在二维中,是由基围成的平行四边形的面积
- 在三维中,是由基所围成的平行六面体的体积
奇异矩阵和非奇异矩阵:
- 奇异矩阵:行列式为0的矩阵
- 非奇异矩阵:行列式不为0的矩阵
矩阵的秩:线性无关的列的数量,一般用r来表示
满秩矩阵 ⇔ \Leftrightarrow ⇔行列式不为0
不满秩矩阵 ⇔ \Leftrightarrow ⇔行列式为0
如果 r ( A ) = n r(A)=n r(A)=n,这个矩阵A是满秩矩阵
如果矩阵是 m × n m×n m×n矩阵,那么 0 ≤ r ( A ) ≤ m i n ( m , n ) 0\le r(A)\le min(m,n) 0≤r(A)≤min(m,n).
行列式的性质:
- 行列式与它的转置行列式相等
- 对换行列式的两行(列),行列式变号 推论:如果行列式有两行(列)完全相同,则此行列式等于零
- 行列式的某一行(列)中所有的元素都乘同一数k,等于用数k乘此行列式 推论:行列式中某一行(列)的所有元素的公因子可以提到行列式记号的外面
- 行列式中如果有两行(列)元素成比例,则此行列式等于零
- 若行列式的某一行(列)的元素都是两数之和,则可以拆分成两个矩阵相加的形式
- 把行列式的某一行(列)的各元素乘同一数然后加到另一行(列)对应的元素上去,行列式不变
行列式运算化简-上三角矩阵/下三角矩阵
余子式:在n阶矩阵的行列式中,把元素 a i j a_{ij} aij所在的i行和j列划去后,留下来的n-1阶矩阵的行列式叫做元素 a i j a_{ij} aij的余子式,记作 M i j M_{ij} Mij.
代数余子式:将 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij记作元素 a i j a_{ij} aij的代数余子式。
伴随矩阵:将一个矩阵中的各个元素所对应的代数余子式按照它的下标来组成一个新的矩阵可得伴随矩阵A*
根据定理可知, A ∗ A = A A ∗ = [ ∣ A ∣ 0 … 0 0 ∣ A ∣ … 0 … … … … 0 0 … ∣ A ∣ ] = ∣ A ∣ E A^*A = AA^* = \begin{bmatrix} |A| & 0 & \dots & 0\\ 0 & |A| & \dots & 0\\ \dots & \dots & \dots & \dots \\ 0 & 0 & \dots & |A| \end{bmatrix}=|A|E A∗A=AA∗= ∣A∣0…00∣A∣…0…………00…∣A∣ =∣A∣E
∣ A A ∗ ∣ = ∣ A ∣ n |AA^*|=|A|^n ∣AA∗∣=∣A∣n
如果矩阵A可逆:
A ∗ = ∣ A ∣ A − 1 A^*=|A|A^{-1} A∗=∣A∣A−1
A − 1 = A ∗ ∣ A ∣ A^{-1}=\frac{A^*}{|A|} A−1=∣A∣A∗
矩阵可逆的充要条件就是矩阵的行列式不为0
四、线性方程组
系数矩阵:由所有方程组系数构成的矩阵
未知数矩阵:元素为x, y, z的列向量
常数矩阵:由方程组等号右边常数所构成的矩阵
增广矩阵:在系数矩阵的基础上,在右侧补充上常数矩阵
矩阵的初等变换(此处以初等行变换为例进行描述,初等列变换同理)
- 对换两行
- 给某一行上的所有元素乘上非零常数k
- 把某一行的k倍加到另一行上
如果矩阵A在经有限次初等变换后变成矩阵B,就称矩阵A和B等价,记作 A ∼ B A\sim B A∼B.
初等矩阵:对单位矩阵进行一次初等变换所得到的矩阵
4.1 非齐次线性方程组
克拉默法则:如果非齐次线性方程组的系数矩阵A的行列式不为0,即 ∣ A ∣ ≠ 0 |A|\ne 0 ∣A∣=0,那么方程组有唯一解:
x 1 = ∣ A 1 ∣ ∣ A ∣ x_1=\frac{|A_1|}{|A|} x1=∣A∣∣A1∣, x 2 = ∣ A 2 ∣ ∣ A ∣ x_2=\frac{|A_2|}{|A|} x2=∣A∣∣A2∣, … , x n = ∣ A n ∣ ∣ A ∣ x_n=\frac{|A_n|}{|A|} xn=∣A∣∣An∣.
其中 A j A_j Aj就是把系数矩阵A中第j列的元素用方程组右侧常数项代替后所得的n阶矩阵。
如果系数矩阵的行列式为0,那么非齐次方程组无解。
非齐次方程组解的情况:
- 有唯一解: r ( A ) = r ( A , β ) = n r(A)=r(A, \beta )=n r(A)=r(A,β)=n,因此它们都是满秩的
- 有无穷多解: r ( A ) = r ( A , β ) < n r(A)=r(A, \beta )<n r(A)=r(A,β)<n,因此它们不满秩
- 无解: r ( A ) < r ( A , β ) r(A)<r(A, \beta) r(A)<r(A,β)
4.2 齐次线性方程组
等号右边全部为0的方程组
齐次线性方程组: A x = 0 Ax=0 Ax=0
齐次方程组解的情况:
- A x = 0 Ax=0 Ax=0只有零解: r ( A ) = n r(A)=n r(A)=n,即A列满秩
- A x = 0 Ax=0 Ax=0有非零解: r ( A ) < n r(A)<n r(A)<n
⭐基础解系:假设向量 ξ 1 , ξ 2 , … , ξ n − r \xi_1, \xi_2,\dots,\xi_{n-r} ξ1,ξ2,…,ξn−r都是方程 A x = 0 Ax=0 Ax=0的解;如果向量 ξ 1 , ξ 2 , … , ξ n − r \xi_1, \xi_2,\dots,\xi_{n-r} ξ1,ξ2,…,ξn−r线性无关,并且方程 A x = 0 Ax=0 Ax=0的任意一个解都可以被这组向量线性表出,我们称这组解为基础解系;如果稀疏矩阵的秩是r,那么基础解系的秩就是 n − r n-r n−r.
如果 ξ 1 , ξ 2 , … , ξ n − r \xi_1, \xi_2,\dots,\xi_{n-r} ξ1,ξ2,…,ξn−r为方程的基础解系,则它们的线性组合 k 1 ξ 1 + k 2 ξ 2 + ⋯ + k n − r ξ n − r k_1\xi_1 + k_2\xi_2+\dots+k_{n-r}\xi_{n-r} k1ξ1+k2ξ2+⋯+kn−rξn−r便是方程通解。
4.3 齐次线性方程组解与非齐次线性方程组解的关系
非齐次通解=特解+齐次通解
【bilibili】非齐次线性方程组求通解
五、特征值与特征向量
A u = λ u Au=\lambda u Au=λu
e.g. A = [ 4 1 0 5 ] A=\begin{bmatrix} 4 & 1\\ 0 &5 \end{bmatrix} A=[4015]
- 特征向量:矩阵A是一种变换,当它作用在特征向量 u u u上的时候, u u u只发生了缩放变换,它的方向并未改变。在上述 A A A矩阵作用下,向量 [ 1 0 ] \begin{bmatrix} 1 \\ 0 \end{bmatrix} [10]和 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} [11]是矩阵的特征向量。
- 特征值:对特征向量对应的拉伸倍数就是特征值。对上述矩阵 A A A,5和4是分别对应的向量 [ 1 0 ] \begin{bmatrix} 1 \\ 0 \end{bmatrix} [10]和 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} [11]的特征值。
A v = λ v ⇒ A v = ( λ I ) v ⇒ ( A − λ I ) v = 0 ⇔ d e t ( A − λ I ) = 0 Av=\lambda v \Rightarrow Av=(\lambda I)v \Rightarrow (A-\lambda I)v=0\Leftrightarrow det(A-\lambda I)=0 Av=λv⇒Av=(λI)v⇒(A−λI)v=0⇔det(A−λI)=0
e.g. d e t ( A − λ I ) = ∣ 4 − λ 1 0 5 − λ ∣ = ( λ − 4 ) ( λ − 5 ) = 0 det(A-\lambda I)=\begin{vmatrix} 4-\lambda & 1\\ 0 & 5-\lambda \end{vmatrix}=(\lambda-4)(\lambda-5)=0 det(A−λI)= 4−λ015−λ =(λ−4)(λ−5)=0.可以得出特征值的结果: λ 1 = 4 , λ 2 = 5 \lambda_1 = 4, \lambda_2 = 5 λ1=4,λ2=5.
求特征向量:把特征值带回特征矩阵中
把可以取任意解的情况都取1,就可以得到特征向量 [ 1 0 ] \begin{bmatrix} 1 \\ 0 \end{bmatrix} [10]和 [ 1 1 ] \begin{bmatrix} 1 \\ 1 \end{bmatrix} [11]了。
主要性质:
- λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 ⋯ + a n n \lambda_1 + \lambda_2 + \dots + \lambda_n = a_{11} + a_{22} \dots + a_{nn} λ1+λ2+⋯+λn=a11+a22⋯+ann:矩阵A主对角线上的元素之和等于矩阵A特征值之和
- λ 1 λ 2 … λ n = ∣ A ∣ \lambda_1 \lambda_2 \dots \lambda_n = |A| λ1λ2…λn=∣A∣:特征值的积等于矩阵的行列式的值
- 如果一个矩阵有特征值0的话,它的行列式也会是0;而如果行列式不等于0,这意味着矩阵的特征值全部不为0
- 特征向量一定是非零向量
- 特征向量的线性组合也是特征向量
六、相似矩阵与相似对角化
6.1 相似矩阵
相似矩阵:如果存在另一个矩阵 B B B,满足 P − 1 A P = B P^{-1}AP=B P−1AP=B,则称矩阵 A A A和矩阵 B B B相似。
相似矩阵的本质就是在不同的基向量下表达同一个线性变换
P − 1 A P P^{-1}AP P−1AP就是一种数学上的转移作用
6.2 相似对角化
已知 A A A是 n n n阶矩阵,如果存在 n n n阶可逆矩阵 P P P满足 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ,则称 A A A可相似对角化。
矩阵 A A A经过相似对角化得到 Λ \Lambda Λ:
在这组基下,线性变换 A A A只沿着坐标轴进行拉伸或压缩,而不进行旋转。
Λ \Lambda Λ:对角矩阵
可逆矩阵 P P P的列就是矩阵 A A A的特征向量; Λ \Lambda Λ对角线上的元素就是这些特征向量所对应的特征值。
矩阵 A A A可以相似对角化的充要条件: A A A有 n n n个线性无关的特征向量;
矩阵 A A A可以相似对角化的充分条件: A A A有 n n n个不同的特征值。
七、二次型
二次型:对于一个多元二次函数,如果每一项的变量数量都是2的话,那么这个函数就是齐次的,称为二次型。
e.g. f = x 2 + 2 y 2 + 3 z 2 + 4 x y + 5 y z + 6 x z = ( x y z ) ( x + 2 y + 3 z 2 x + 2 y + 2.5 z 3 x + 2.5 y + 3 z ) = ( x y z ) ( 1 2 3 2 2 2.5 3 2.5 3 ) ( x y z ) f=x^2+2y^2+3z^2+4xy+5yz+6xz = \begin{pmatrix} x & y & z \end{pmatrix}\begin{pmatrix} x+2y+3z \\ 2x+2y+2.5z \\ 3x+2.5y+3z\end{pmatrix}=\begin{pmatrix} x & y & z \end{pmatrix}\begin{pmatrix} 1&2&3 \\ 2&2&2.5 \\ 3&2.5&3 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix} f=x2+2y2+3z2+4xy+5yz+6xz=(xyz) x+2y+3z2x+2y+2.5z3x+2.5y+3z =(xyz) 123222.532.53 xyz .(“对半分”,保证矩阵结果唯一)
f = x T A x f=x^TAx f=xTAx
任意给定一个对称矩阵可以唯一确定一个二次型;任意给定一个二次型就可以唯一确定一个对称矩阵。
二次型与对称矩阵存在一一对应的关系
对称矩阵 A A A叫做二次型 f f f的矩阵,也把 f f f叫做对称矩阵 A A A的二次型。同时矩阵 A A A的秩就叫做二次型 f f f的秩。
矩阵合同:如果存在一个可逆矩阵 C C C,满足 C T A C = B C^TAC=B CTAC=B,则称矩阵 A A A和 B B B合同。
注:矩阵的迹:矩阵主对角线所有元素之和,也是所有特征值的和
一个只含有平方项的二次型称之为二次型的标准形。
如果标准形的系数只能取为1, -1, 0的话,那么我们称这个标准型为规范型。
参考资料:
[1] https://www.bilibili.com/video/BV1o34y1T7vh/