参考视频: 一个小时速通线性代数全概念 一个小时速通线性代数全概念 一个小时速通线性代数全概念
向量与线性组合
- 向量点乘(内积): a → ⋅ b → = ∑ i = 1 n a i b i = ∣ a → ∣ ∣ b → ∣ cos θ \overrightarrow{a} \cdot \overrightarrow{b}=\sum^n_{i=1}a_ib_i=|\overrightarrow{a}||\overrightarrow{b}|\cos\theta a⋅b=∑i=1naibi=∣a∣∣b∣cosθ
- 线性组合:令 c 1 , c 2 , ⋯ , c k c_1,c_2,\cdots,c_k c1,c2,⋯,ck为常数, v 1 , v 2 , ⋯ , v k v_1,v_2,\cdots,v_k v1,v2,⋯,vk为 R n \mathbb{R}^n Rn中的向量, c 1 v 1 + c 2 v 2 + ⋯ + c k v k c_1v_1+c_2v_2+\cdots+c_kv_k c1v1+c2v2+⋯+ckvk为向量的线性组合。
- 线性无关:n个向量组成的向量组的线性组合只在系数全部为零是为零,线性相关即存在不全为零的系数使得线性组合为零。
- 张成空间为向量组的全部线性组合所构成的向量集合。n个线性无关的向量能够张成一个n维空间,向量组可以张成的维度
n
就是向量组的秩r
。
矩阵与线性变换
-
标准正交基:两两垂直,长度为1的基
-
每个线性变换都可以由一个矩阵表示。对于每个矩阵我们都可以将其看作把它的每一列由单位矩阵的对应列变换而来的基向量。例如: A = [ 1 − 1 1 0 ] A=\left[\begin{matrix}1 &-1 \\ 1 &0 \end{matrix}\right] A=[11−10]就是把基 i → = ( 1 0 ) , j → = ( 0 1 ) \overrightarrow{i}=\left(\begin{array}{}1 \\ 0\end{array}\right),\overrightarrow{j}=\left(\begin{array}{}0 \\ 1\end{array}\right) i=(10),j=(01)变换为 i → = ( 1 1 ) , j → = ( − 1 0 ) \overrightarrow{i}=\left(\begin{array}{}1 \\ 1\end{array}\right),\overrightarrow{j}=\left(\begin{array}{}-1 \\ 0\end{array}\right) i=(11),j=(−10)的线性变换。
例如我们想要知道 [ x y ] \left[\begin{matrix}x \\ y\end{matrix}\right] [xy]经过 A = [ 1 − 1 1 0 ] A=\left[\begin{matrix}1 &-1 \\ 1 &0 \end{matrix}\right] A=[11−10]变换后的位置只需要计算 x ( 1 1 ) + y ( − 1 0 ) x\left(\begin{array}{}1 \\ 1\end{array}\right)+y\left(\begin{array}{}-1 \\ 0\end{array}\right) x(11)+y(−10),即为 [ x y ] \left[\begin{matrix}x \\ y\end{matrix}\right] [xy]在变换后的坐标对应的标准平面直角坐标系的坐标。
而如果乘以 A − 1 A^{-1} A−1的话,就能得到标准直角坐标系的坐标在 A A A变换后坐标系中的坐标。
-
矩阵之间的乘法,则可以看作是依次进行了多个线性变换。
行列式
-
如果把矩阵看作一个线性变换,那么矩阵的行列式就代表经过矩阵变换后的单位面积(或高维单位多面体体积)的缩放倍数,由此我们也不难得出 ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB|=|A||B| ∣AB∣=∣A∣∣B∣。
-
如果行列式的值为零,则说明空间被压缩到了更小的维度上去,我们称行列式为零的矩阵为奇异矩阵。
-
矩阵的秩:线性无关的列的数量,一般用r来表示 r ( A ) r(A) r(A)变换后的空间维数。如果 r ( A ) = n r(A)=n r(A)=n,那么方阵 A n × n A_{n\times n} An×n是满秩矩阵,如果矩阵是 m × n m\times n m×n矩阵,那么 0 ≤ r ( A ) ≤ m i n ( m , n ) 0\leq r(A)\leq min(m,n) 0≤r(A)≤min(m,n)
-
满秩矩阵(变换不会压缩空间维度) ⇔ \Leftrightarrow ⇔行列式不为零,不满秩矩阵 ⇔ \Leftrightarrow ⇔行列式为零。
-
余子式:在
n
阶矩阵的行列式中,把元素 a i j a_{ij} aij所在的第i行和第j列划去之后,留下来的n-1
阶矩阵的行列式叫做元素 a i j a_{ij} aij的余子式,记作 M i j M_{ij} Mij。 -
代数余子式:将 A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M_{ij} Aij=(−1)i+jMij记作 a i j a_{ij} aij的代数余子式。
-
代数余子式定理:行列式等于它的任意一行或列的各元素与其对应的代数余子式的乘积之和:
∣ A ∣ = ∑ i = 1 n a i k A i k = ∑ j = 1 n a k j A k j |A|=\sum^n_{i=1}a_{ik}A_{ik}=\sum^n_{j=1}a_{kj}A_{kj} ∣A∣=i=1∑naikAik=j=1∑nakjAkj。而任意一行(列)的所有元素与另一行(列)的所有元素对应的代数余子式的乘积之和为0(也很好证明,相当于行列式中有两行(列)一样,初等变换之后有一行(列)全零)
-
伴随矩阵 A ∗ A^* A∗,每个元素 a i j ∗ a^*_{ij} aij∗都是矩阵 A A A中 a i j a_{ij} aij对应的代数余子式的矩阵,称为伴随矩阵。对于n阶矩阵 A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ] A=\left[\begin{matrix}a_{11} &a_{12} &\cdots &a_{1n}\\ a_{21} &a_{22} &\cdots &a_{2n}\\ \vdots &\vdots &\ddots &\vdots\\ a_{n1} &a_{n2} &\cdots &a_{nn} \end{matrix}\right] A= a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann ,其伴随矩阵为 A ∗ = [ A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ] A^*=\left[\begin{matrix}A_{11} &A_{21} &\cdots &A_{n1}\\ A_{12} &A_{22} &\cdots &A_{n2}\\ \vdots &\vdots &\ddots &\vdots\\ A_{1n} &A_{2n} &\cdots &A_{nn} \end{matrix}\right] A∗= A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann ,其中 A i j A_{ij} Aij表示 a i j a_{ij} aij的代数余子式, 注意伴随矩阵的行列下标是相反的
-
由代数余子式定理可以推导 A A ∗ = A ∗ A = [ ∣ A ∣ 0 ⋯ 0 0 ∣ A ∣ ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ ∣ A ∣ ] = ∣ A ∣ E AA^*=A^*A=\left[\begin{matrix}|A| &0 &\cdots &0 \\0 &|A| &\cdots &0 \\ \vdots &\vdots & & \vdots \\ 0 &0 &\cdots &|A| \end{matrix}\right]=|A|E AA∗=A∗A= ∣A∣0⋮00∣A∣⋮0⋯⋯⋯00⋮∣A∣ =∣A∣E,那么我们就可以得到 A A A的逆矩阵 A − 1 = 1 ∣ A ∣ A ∗ A^{-1}=\frac{1}{|A|}A^* A−1=∣A∣1A∗。也由此可知矩阵可逆的充要条件:行列式不为零。
线性方程组
假设我们有一个方程组 { x + 2 y + z = 1 x + 3 y + 2 z = 0 2 x + y + z = 1 \left\{\begin{array}{}x+2y+z=1\\x+3y+2z=0\\2x+y+z=1\end{array}\right. ⎩ ⎨ ⎧x+2y+z=1x+3y+2z=02x+y+z=1(非齐次线性方程组)
-
齐次线性方程组:等式右边全部为0的方程组
-
系数矩阵:由所有方程组系数构成的矩阵
-
上述非齐次线性方程组的几何意义:求在以系数矩阵 A A A为基的坐标系中的未知数向量 α \alpha α使得其在平面直角坐标系中的坐标为常数矩阵 β \beta β。
-
克拉默法则:如果非齐次线性方程组的系数矩阵 A A A的行列式不为0,那么方程组有唯一解。且 x j = ∣ A j ∣ ∣ A ∣ x_j=\frac{|A_j|}{|A|} xj=∣A∣∣Aj∣,其中 A j A_j Aj代表将系数矩阵的第
j
列替换为常数矩阵之后得到的n
阶矩阵。 -
将常数矩阵拼接到系数矩阵后面,可以得到增广矩阵 A , β A,\beta A,β:
- 有唯一解 ⇔ r ( A ) = r ( A , β ) = n \Leftrightarrow r(A)=r(A,\beta)=n ⇔r(A)=r(A,β)=n,即系数矩阵和增广矩阵都是满秩的。
- 有无穷多解 ⇔ r ( A ) = r ( A , β ) < n \Leftrightarrow r(A)=r(A,\beta)\lt n ⇔r(A)=r(A,β)<n,即系数矩阵和增广矩阵都不满秩的。
- 无解 ⇔ r ( A ) ≤ r ( A , β ) \Leftrightarrow r(A)\le r(A,\beta) ⇔r(A)≤r(A,β)。
-
将增广矩阵 A , β A,\beta A,β 通过初等行变换如果可以变为 E , γ E,\gamma E,γ;那么 γ \gamma γ就是方程组的解。
-
求矩阵的逆也可以将增广矩阵 A , E A,E A,E通过初等行变换变为 E , A − 1 E,A^{-1} E,A−1。
-
对于齐次线性方程组 A x = 0 Ax=0 Ax=0
- 逆矩阵法显然只能得到0向量,采用初等行变换对增广矩阵变换,得到的全零行假设是第j行,就代表未知数 x j x_j xj可以取任意值。
- A x = 0 Ax=0 Ax=0只有零解 ⇔ r ( A ) = n \Leftrightarrow r(A)=n ⇔r(A)=n(即A列满秩)
- A x = 0 Ax=0 Ax=0有非零解 ⇔ r ( A ) < n \Leftrightarrow r(A)<n ⇔r(A)<n,即 ∣ A ∣ = 0 |A|=0 ∣A∣=0
-
假设向量 ζ 1 , ζ 2 , ⋯ , ζ n − r \zeta_1,\zeta_2,\cdots,\zeta_{n-r} ζ1,ζ2,⋯,ζn−r都是 A x = 0 Ax=0 Ax=0的解,如果向量 ζ 1 , ζ 2 , ⋯ , ζ n − r \zeta_1,\zeta_2,\cdots,\zeta_{n-r} ζ1,ζ2,⋯,ζn−r线性无关,并且方程 A x = 0 Ax=0 Ax=0的任意一个解都可以被 ζ 1 , ζ 2 , ⋯ , ζ n − r \zeta_1,\zeta_2,\cdots,\zeta_{n-r} ζ1,ζ2,⋯,ζn−r线性表示出来,我们称这组解为基础解系,如果系数矩阵的秩是
r
,那么基础解系的秩就是n-r
。 -
齐次线性方程组解与非齐次线性方程组解的关系:
- 如果 η \eta η是非齐次解, ζ \zeta ζ是齐次解,则 η + ζ \eta+\zeta η+ζ是非齐次线性方程组 A x + b Ax+b Ax+b的解。
- 如果 η \eta η是非齐次解, k 1 ζ 1 + k 2 ζ 2 ⋯ + k n − r ζ n − r k_1\zeta_1+k_2\zeta_2\cdots+k_{n-r}\zeta_{n-r} k1ζ1+k2ζ2⋯+kn−rζn−r是对应的齐次通解,则 η + k 1 ζ 1 + k 2 ζ 2 ⋯ + k n − r ζ n − r \eta+k_1\zeta_1+k_2\zeta_2\cdots+k_{n-r}\zeta_{n-r} η+k1ζ1+k2ζ2⋯+kn−rζn−r为非齐次的通解。同时 η , ζ 1 , ζ 2 , ⋯ , ζ n − r \eta,\zeta_1,\zeta_2,\cdots,\zeta_{n-r} η,ζ1,ζ2,⋯,ζn−r线性无关且 η , η + ζ 1 , η + ζ 2 , ⋯ , η + ζ n − r \eta,\eta+\zeta_1,\eta+\zeta_2,\cdots,\eta+\zeta_{n-r} η,η+ζ1,η+ζ2,⋯,η+ζn−r是非齐次方程的 n − r + 1 n-r+1 n−r+1个线性无关的解。
- 如果 η 1 , η 2 , ⋯ , η k , η \eta_1,\eta_2,\cdots,\eta_k,\eta η1,η2,⋯,ηk,η是非齐次方程的 k + 1 k+1 k+1个线性无关的解,则 η 1 − η , η 2 − η 1 , ⋯ , η s − η \eta_1-\eta,\eta_2-\eta_1,\cdots,\eta_s-\eta η1−η,η2−η1,⋯,ηs−η是对应齐次方程的 k k k个线性无关的解。
-
求 A x = 0 Ax=0 Ax=0的通解:
把系数矩阵 A A A通过初等行变换,消掉线性相关的行,剩余 n − r ( A ) n-r(A) n−r(A)个线性无关的方程可以确定 n − r ( A ) n-r(A) n−r(A)个主元(可以随便选那行系数不为0的未知数为主元),假设主元集合为 x k 1 , x k 2 , ⋯ , x k n − r ( A ) x_{k_1},x_{k_2},\cdots,x_{k_{n-r(A)}} xk1,xk2,⋯,xkn−r(A),分别带入 ( 1 , 0 , ⋯ , 0 ) 、 ( 0 , 1 , ⋯ , 0 ) 、 ⋯ 、 ( 0 , 0 , ⋯ , 1 ) (1,0,\cdots,0)、(0,1,\cdots,0)、\cdots、(0,0,\cdots,1) (1,0,⋯,0)、(0,1,⋯,0)、⋯、(0,0,⋯,1),可以得到向量 ζ 1 , ζ 2 , ⋯ , ζ n − r \zeta_1,\zeta_2,\cdots,\zeta_{n-r} ζ1,ζ2,⋯,ζn−r都是 A x = 0 Ax=0 Ax=0的解。
-
求 A x = b Ax=b Ax=b的特解:
同上 A x = 0 Ax=0 Ax=0部分中找主元的方式,找到主元,然后所有自由元为0,然后解出主元,这个向量即为 A x = b Ax=b Ax=b的特解。
特征值与特征向量
- 令 A A A为变换矩阵, v v v为特征矩阵, λ \lambda λ为特征值,有 A v = λ v Av=\lambda v Av=λv。
- 特征值与特征向量的几何意义:特征向量经过对应的矩阵变换之后,仍然在同一条直线方向上,等同于乘以特征值标量的缩放(如果特征值标量小于零就是反向)。
- 特征向量与特征值的求法:
- 令 I I I为单位矩阵 A v = ( λ I ) v → ( A − λ I ) v = 0 Av=(\lambda I)v\rightarrow (A-\lambda I)v=0 Av=(λI)v→(A−λI)v=0即 ∣ A − λ I ∣ = 0 |A-\lambda I|=0 ∣A−λI∣=0,求解这个行列式即可得到特征值的解:例如若 A = [ 4 1 0 5 ] A=\left[\begin{matrix}4 &1\\0 &5\end{matrix}\right] A=[4015],当 ∣ A − λ I ∣ = [ 4 − λ 1 0 5 − λ ] = ( 4 − λ ) ( 5 − λ ) = 0 → { λ = 4 λ = 5 |A-\lambda I|=\left[\begin{matrix}4-\lambda &1\\0 &5-\lambda\end{matrix}\right]=(4-\lambda)(5-\lambda)=0\rightarrow\left\{\begin{array}{}\lambda=4\\ \lambda=5\end{array}\right. ∣A−λI∣=[4−λ015−λ]=(4−λ)(5−λ)=0→{λ=4λ=5 。
- 求得 λ \lambda λ的值之后,带入 ( A − λ I ) v = 0 (A-\lambda I)v=0 (A−λI)v=0,参考前文中的齐次线性方程组 A x = 0 Ax=0 Ax=0求解方式,即可得到特征向量。
- 性质:
- λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a n n \lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{nn} λ1+λ2+⋯+λn=a11+a22+⋯+ann即特征值的和等于矩阵 A A A主对角线上的元素
- λ 1 λ 2 ⋯ λ n = ∣ A ∣ \lambda_1\lambda_2\cdots\lambda_n=|A| λ1λ2⋯λn=∣A∣,所以一个矩阵的特征值有0的话,矩阵的行列式为0;矩阵的行列式不为零,则所有特征值都不为0.
- 特征向量一定是非零向量,同一矩阵的不同一特征值的特征向量线性无关。所以同一特征值的特征向量的线性组合仍然是该特征值的特征向量,但是不同特征值的特征向量的线性组合(系数非零)一定不是该矩阵的特征向量。
- 如果一个特征值为
k
重特征值,则属于特征值 λ \lambda λ的线性无关的特征向量最多有k
个。
相似矩阵与相似对角化
-
相似矩阵:如果存在另一个矩阵 B B B,满足 P − 1 A P = B P^{-1}AP=B P−1AP=B,那么我们称矩阵 A A A和矩阵 B B B相似, A ∼ B A\sim B A∼B。
-
相似矩阵的本质就是在不同的基向量下表达同一个线性变换, P − 1 A P P^{-1}AP P−1AP
-
矩阵相似的一些性质:
- 如果 f ( A ) f(A) f(A)是 A A A的一个多项式,则 f ( A ) ∼ f ( B ) f(A)\sim f(B) f(A)∼f(B)
- 有 A − 1 ∼ B − 1 , A T ∼ B T , A ∗ ∼ B ∗ A^{-1}\sim B^{-1},A^T\sim B^T,A^*\sim B^* A−1∼B−1,AT∼BT,A∗∼B∗
- R ( A ) = R ( B ) , ∣ A ∣ = ∣ B ∣ R(A)=R(B),|A|=|B| R(A)=R(B),∣A∣=∣B∣, A A A与 B B B的特征值相同。
- 如果 A A A与 B B B都是 n n n解矩阵并且 A A A可逆,则 A B ∼ B A AB\sim BA AB∼BA;
- 如果 A 1 ∼ B 1 A_1\sim B_1 A1∼B1, A 2 ∼ B 2 A_2\sim B_2 A2∼B2则 ( A 1 0 0 A 2 ) ∼ ( B 1 0 0 B 2 ) \left(\begin{matrix}A_1 &0\\ 0 &A_2 \end{matrix}\right) \sim \left(\begin{matrix}B_1 &0 \\ 0 &B_2 \end{matrix}\right) (A100A2)∼(B100B2);
-
相似对角化:已知 A A A是 n n n阶矩阵,如果存在 n n n阶可逆矩阵 P P P满足 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ,则称 A A A可相似对角化。 A ⟹ 相似对角化 Λ A\stackrel{相似对角化}\Longrightarrow \Lambda A⟹相似对角化Λ
在 P P P这组基下,线性变换 A A A只沿着坐标轴进行拉伸或者压缩,而不进行旋转。
可逆矩阵 P P P的列就是矩阵 A A A的单位特征向量。 Λ \Lambda Λ对角线上的元素就是这些特征向量所对应的特征值。
矩阵 A A A可以相似对角化的充要条件就是A有n个线性无关的特征向量,换言之矩阵每个k重特征值的线性无关的特征向量的个数为k。
二次型与合同
对于一个多元二次函数,如果每一项的次数和都是2的话,那么这个函数就是齐次的,称为二次型。
我们用下面这个例子来引出这一章的内容:
f = x 2 + 2 y 2 + 3 z 2 + 4 x y + 5 y z + 6 x z = ( x 2 + 2 x y + 3 x z ) + ( 2 y 2 + 2 x y + 2.5 y z ) + ( 3 z 2 + 3 x z + 2.5 y z ) = x ( x + 2 y + 3 z ) + y ( 2 x + 2 y + 2.5 z ) + z ( 3 x + 2.5 y + 3 z ) = ( x y z ) ( x + 2 y + 3 x 2 x + 2 y + 2.5 z 3 x + 2.5 y + 3 z ) = ( x y z ) ( 1 2 3 2 2 2.5 3 2.5 3 ) ( x y z ) \begin{equation}\begin{split}f&=x^2+2y^2+3z^2+4xy+5yz+6xz \\&=(x^2+2xy+3xz)+(2y^2+2xy+2.5yz)+(3z^2+3xz+2.5yz)\\&=x(x+2y+3z)+y(2x+2y+2.5z)+z(3x+2.5y+3z)\\&=\left(\begin{array}{}x &y &z\end{array}\right) \left(\begin{array}{}x+2y+3x \\2x+2y+2.5z \\ 3x+2.5y+3z\end{array}\right) \\&=\left(\begin{array}{}x &y &z\end{array}\right) \left(\begin{array}{}1&2&3 \\2&2&2.5 \\ 3&2.5&3\end{array}\right)\left(\begin{array}{}x\\ y\\ z\end{array}\right) \end{split}\end{equation} f=x2+2y2+3z2+4xy+5yz+6xz=(x2+2xy+3xz)+(2y2+2xy+2.5yz)+(3z2+3xz+2.5yz)=x(x+2y+3z)+y(2x+2y+2.5z)+z(3x+2.5y+3z)=(xyz) x+2y+3x2x+2y+2.5z3x+2.5y+3z =(xyz) 123222.532.53 xyz
即有二次型可以使用如下表达式表示: f = x T A x f=x^TAx f=xTAx
-
更常见地有:
f ( x 1 , x 2 , ⋯ , x n ) = a 11 x 1 2 + a 22 x 2 2 + ⋯ + a n n x n 2 + a 12 x 1 x 2 + ⋯ + a n − 1 , n x n − 1 x n = ( x 1 x 2 ⋯ x n ) ( a 11 a 12 2 ⋯ a 1 n 2 a 12 2 a 22 ⋯ a 2 n 2 ⋮ ⋮ ⋱ ⋮ a 1 n 2 a 2 n 2 ⋯ a n n ) ( x 1 x 2 ⋮ x n ) \begin{equation}\begin{split}f(x_1,x_2,\cdots,x_n)&=a_{11}x_1^2+a_{22}x_2^2+\cdots+a_{nn}x^2_n+a_{12}x_1x_2+\cdots+a_{n-1,n}x_{n-1}x_n\\&=\left(\begin{array}{}x_1 &x_2 &\cdots &x_n\end{array}\right) \left(\begin{array}{}a_{11}&\frac{a_{12}}{2}&\cdots&\frac{a_{1n}}{2} \\\frac{a_{12}}{2}&a_{22}&\cdots&\frac{a_{2n}}{2} \\ \vdots &\vdots &\ddots &\vdots \\ \frac{a_{1n}}{2}&\frac{a_{2n}}{2}&\cdots&a_{nn} \end{array}\right)\left(\begin{array}{} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right) \end{split}\end{equation} f(x1,x2,⋯,xn)=a11x12+a22x22+⋯+annxn2+a12x1x2+⋯+an−1,nxn−1xn=(x1x2⋯xn) a112a12⋮2a1n2a12a22⋮2a2n⋯⋯⋱⋯2a1n2a2n⋮ann x1x2⋮xn
二次型与对称矩阵存在一一对应的关系,对称矩阵 A A A叫做二次型 f f f的矩阵,也把 f f f叫做对称矩阵 A A A的二次型。同时矩阵 A A A的秩就叫做二次型 f f f的秩。
-
合同:如果存在一个可逆矩阵 C C C,满足 C T A C = B C^TAC=B CTAC=B,则称矩阵 A A A和 B B B合同。
-
合同的几何意义:同一个二次曲线在不同基下需要用不同的二次型矩阵表示。
等价、相似与合同的关系:
- 矩阵等价只需要矩阵等秩 R ( A ) = R ( B ) R(A)=R(B) R(A)=R(B),向量组等价不仅需要等秩,还需要可以相互线性表示出即 R ( A ) = R ( B ) = R ( A , B ) R(A)=R(B)=R(A,B) R(A)=R(B)=R(A,B)
- 矩阵相似则一定等价,所以如果矩阵相似则有等秩且特征值相同;但是特征值相同未必相似,除非是实对称矩阵。(证明两矩阵相似:实对称矩阵,且特征值相同)
- 矩阵合同则一定等价,所以如果矩阵合同则等秩且正负特征值个数相同,但正负特征值个数相同未必合同,除非是实对称矩阵;(证明两矩阵合同:实对称矩阵,且正负特征值个数相同)
- 如果矩阵是实对称矩阵,则有 相似 → 合同 → 等价 相似\rightarrow合同\rightarrow等价 相似→合同→等价;
- 如果需要判断两个实对称的矩阵的合同与相似:首先计算迹(特征值之和)与行列式(特征值的积)是否相同,不相同则一定不相似;然后再计算特征值根据正负个数判定是否合同。
一个只含有平方项的二次型我们称之为二次型的标准型。如果标准型的系数只能取值为1,-1,0的话,我们称这个标准型为规范形。
要将一个二次型转化为标准型,我们可以使用配方法,例如:
f = 3 x 1 2 + 2 x 1 x 2 + x 2 2 = ( x 1 + x 2 ) 2 + 2 x 1 2 = x T A x f=3x_1^2+2x_1x_2+x_2^2=(x_1+x_2)^2+2x_1^2=x^TAx f=3x12+2x1x2+x22=(x1+x2)2+2x12=xTAx
令 { y 1 = x 1 + x 2 y 2 = x 1 , 有 f = y 1 2 + 2 y 2 2 = y T B y \begin{cases}y_1=x_1+x_2\\y_2=x_1\end{cases},有f=y_1^2+2y_2^2=y^TBy {y1=x1+x2y2=x1,有f=y12+2y22=yTBy
显然有 ( y 1 y 2 ) = ( 1 1 0 1 ) ( x 1 x 2 ) \left(\begin{matrix}y_1\\y_2\end{matrix}\right)=\left(\begin{matrix}1&1\\0&1\end{matrix}\right)\left(\begin{matrix}x_1\\x_2\end{matrix}\right) (y1y2)=(1011)(x1x2)
求逆矩阵可以得到 ( x 1 x 2 ) = ( 1 − 1 0 1 ) ( y 1 y 2 ) = C y \left(\begin{matrix}x_1\\x_2\end{matrix}\right)=\left(\begin{matrix}1&-1\\0&1\end{matrix}\right)\left(\begin{matrix}y_1\\y_2\end{matrix}\right)=Cy (x1x2)=(10−11)(y1y2)=Cy
∵ f = x T A x = y T B y ∴ y T C T A C y = y T B y → C T A C 合同 B \because f=x^TAx=y^TBy \therefore y^TC^TACy=y^TBy\rightarrow C^TAC合同B ∵f=xTAx=yTBy∴yTCTACy=yTBy→CTAC合同B
- 正交矩阵:当 P P T = I PP^T=I PPT=I或 P T P = I P^TP=I PTP=I成立时,称 P P P为正交矩阵,正交矩阵合同变换时只做关于圆心的旋转,并不进行任何的拉伸。
- 正交矩阵的各行各列都是单位向量且两两相交
- 由于正交矩阵的转置等于他的逆矩阵,因此 B = P T A P = P − 1 A P B=P^TAP=P^{-1}AP B=PTAP=P−1AP合同变换同时还是相似变换。
- 给定任意二次型
f
f
f,总有正交变换
x
=
P
y
x=Py
x=Py 使得
f
f
f化为标准型
f
=
λ
1
y
1
2
+
λ
2
y
2
2
+
⋯
+
λ
n
y
n
2
f=\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2
f=λ1y12+λ2y22+⋯+λnyn2,其中
λ
1
,
λ
2
,
⋯
,
λ
n
\lambda_1,\lambda_2,\cdots,\lambda_n
λ1,λ2,⋯,λn是
f
f
f的矩阵
A
A
A的特征值。
- 利用正交矩阵,我们也可以将二次型转换为标准形,参考相似变换中的相似对角化 P − 1 A P = Λ P^{-1}AP=\Lambda P−1AP=Λ,构造每一列都是单位特征向量的矩阵 P P P即可构造出正交变换 x = P y x=Py x=Py。
二次型的标准形不唯一。
- 惯性定理:二次型的标准形中正系数的个数称为二次型的正惯性指数,负系数的个数为负惯性指数。
- 正定矩阵,如果二次型
f
(
x
)
=
x
T
A
x
f(x)=x^TAx
f(x)=xTAx满足对任何
x
≠
0
x\neq 0
x=0都有
f
(
x
)
>
0
f(x)\gt 0
f(x)>0,则称
f
(
x
)
f(x)
f(x)为正定二次型,称
A
A
A为正定矩阵。反之为负定矩阵:如果二次型
f
(
x
)
=
x
T
A
x
f(x)=x^TAx
f(x)=xTAx满足对任何
x
≠
0
x\neq 0
x=0都有
f
(
x
)
<
0
f(x)\lt 0
f(x)<0,则称
f
(
x
)
f(x)
f(x)为负定二次型,称
A
A
A为负定矩阵。
- 正定矩阵的充分必要条件:
- 标准形的系数全为正数,即正惯性系数为1;
- 特征值全为正,参考正交矩阵下的第四点。
- 与单位矩阵合同,即存在可逆矩阵C,满足
C
T
A
C
=
E
C^TAC=E
CTAC=E
任何 x ≠ 0 x\neq 0 x=0都有 f ( x ) < 0 f(x)\lt 0 f(x)<0,则称 f ( x ) f(x) f(x)为负定二次型,称 A A A为负定矩阵。
- 正定矩阵的充分必要条件:
- 标准形的系数全为正数,即正惯性系数为1;
- 特征值全为正,参考正交矩阵下的第四点。
- 与单位矩阵合同,即存在可逆矩阵C,满足 C T A C = E C^TAC=E CTAC=E
- 正定矩阵的充分必要条件: