矩阵基本知识

海棠未语

已于 2024-05-10 22:31:44 修改

阅读量1.3k

点赞数 7

文章标签：矩阵算法线性代数人工智能

于 2024-05-10 22:28:43 首次发布

本文链接：https://blog.csdn.net/qq_43016560/article/details/138587014

版权

一、矩阵分类

1、行矩阵
只有一行的矩阵，称为行矩阵，又称行向量
$A=(a_1,a_2,...,a_n)$
2、列矩阵
只有一列的矩阵，称为列矩阵，又称列向量
$\begin{Bmatrix} {b_1} \\ {b_2} \\ ... \\ {b_m} \end{Bmatrix}$
3、同型矩阵
两个矩阵的行数相等，列数也相等时，就称它们是同型矩阵。它们可以进行矩阵加法和乘法运算。
$\left[ \begin{matrix} 1 & 2\\ 3 & 4\\ \end{matrix} \right] , B= \left[ \begin{matrix} 5 & 6\\ 7 & 8\\ \end{matrix} \right]$
矩阵 A 和 B 都是 2×2 的矩阵，即A和B是同型矩阵，因此可以进行加法和乘法运算

4、方阵
行数与列数都等于n的矩阵称为n阶矩阵或n阶方阵，记作 $A_n$
$\left[ \begin{matrix} 1 & 2& 3\\ 3 & 4& 5\\ 5 & 7& 9\\ \end{matrix} \right]$
矩阵C是一个3阶矩阵即3阶方阵

5、实矩阵
元素都是实数的矩阵，称为实矩阵

6、复矩阵
元素都是复数的矩阵，称为复矩阵

7、零矩阵
元素都是零的矩阵，称为零矩阵

8、对角矩阵
从左上角到右下角的直线（叫做对角线）以外的元素都是0，这种方阵称为对角矩阵，简称对角阵。
$\left[ \begin{matrix} {k_1} & {0} & \dots & {0}\\ {0} & {k_2} &\dots & {0}\\ \vdots & \vdots & \vdots & \vdots \\ {0} & {0} & \dots & {k_n} \end{matrix} \right]$

9、单位矩阵
方阵对角线上的元素都是1，其他元素都是0，叫 $n$ 阶单位矩阵，简称单位阵。
$\left[ \begin{matrix} {1} & {0} & \dots & {0}\\ {0} & {1} &\dots & {0}\\ \vdots & \vdots & \vdots & \vdots \\ {0} & {0} & \dots & {1} \end{matrix} \right]$

二、矩阵的运算

（一）加法运算规律

只有当两个矩阵是同型矩阵，两个矩阵才能进行加法运算。
设 $A 、 B 、 C$ 都是 $m * n$ 矩阵

① $A + B = B + A$
② $（ A + B ） + C = A + （ B + C ）$

③ $- A$ 称为矩阵 $A$ 的负矩阵。
$A + （ - A ） = 0$

④矩阵减法
$A - B = A + （ - B ）$

（二）矩阵数乘运算规律

设 $A 、 B$ 都是 $m * n$ 矩阵， $\lambda、\mu$ 为标量

① $(\lambda\mu)A=\lambda(\mu A)$

② $(\lambda + \mu)A=\lambda A+\mu A$

③ $\lambda(A+B)=\lambda A + \lambda B$

矩阵的加法与矩阵的数乘统称为矩阵的线性运算

（三）矩阵与矩阵相乘

当一个矩阵（左矩阵）的列数等于第二个矩阵（右矩阵）的行数时，两个矩阵才能相乘，其结果为左矩阵的行数与右矩阵的列数。

一般情况下 $\neq B*A$
对于两个 $n$ 阶方阵 $A 、 B$ ，若 $A * B = B * A$ ，则称方针 $A 与 B$ 是可交换的。

注意：
若有两个方阵 $A 、 B$ 满足 $A * B = 0$ ，不能得出 $A = 0 ， B = 0$ 的结论
若 $\neq 0$ ,而 $A (X - Y) = 0$ ,也不能得出 $X = Y$ 的结论

矩阵乘法不满足交换律但满足结合律和分配律
① $(A B) C = A (BC)$
② $\lambda(AB)=(\lambda A)B = A(\lambda B)$
③ $A (B + C) = A B + A C$ ; $(B + C) A = B A + C A$

④单位矩阵E
$E A = A E = A$
$(\lambda E)A=\lambda A$
$A(\lambda E)=\lambda A$

矩阵的幂

设 $A$ 是 $n$ 阶方阵
$A^1=A,A^2=A^1A^1,\dots,A^{k+1}=A^kA^1,k为正整数$
$A^k$ 就是 $k$ 个 $A$ 连乘，显然只有方阵的幂才有意义。
$A^kA^l=A^{k+l}$ , $A^k)^l=A^{kl}$

（四）矩阵的转置

把矩阵 $A$ 的行换成同序数的列，得到一个新矩阵，叫做 $A$ 的转置矩阵，记作 $A^T$

矩阵的转置也是一种运算，满足下述运算规律：
① $A^T)^T=A$
② $A+B)^T=A^T+B^T$
③ $(\lambda A)^T=\lambda A^T$
④ $AB)^T=B^TA^T$

矩阵转置的作用

简化计算：在进行矩阵乘法运算时，特别是在处理大规模问题时，通过利用转置的性质，可以简化计算过程，例如在矩阵乘法中利用转置减少乘法的次数。
对称性分析：对于特定的方阵，如果一个矩阵满足其转置等于自身（即A = A^T），则称该矩阵为对称矩阵。对称矩阵在物理学和工程学中有广泛的应用，因为它们代表了某些具有内在对称性的系统。
变换性质的探究：在图像处理或计算机图形学中，矩阵用来描述物体的旋转、缩放和平移等变换。矩阵转置可以帮助我们理解和实现这些变换的逆过程，例如，通过对描述旋转的矩阵进行转置，可以得到逆向旋转的效果。

对称矩阵
设 $A$ 是 $n$ 阶方阵，如果满足 $A^T=A,即$
$a_{ij}=a_{ji}$ $(i, j = 1, 2, ..., n)$
那么 $A$ 称为对称矩阵，简称对称阵，对称矩阵的特点是：它的元素以对角线为对称轴对应相等。

（五）方阵的行列式

由 $n$ 阶方阵 $A$ 的元素构成的行列式（各元素的位置不变），称为方阵 $A$ 的行列式，记作 $d e t A 或 ∣ A ∣$

方阵与行列式的区别
方阵： $n$ 阶方阵是 $n^2$ 个数按一定方式排成的数表
$n$ 阶行列式：是这些数（也就是数表 $A$ ）按一定的运算法则所确定的一个数

行列式运算规律：
设 $A 、 B$ 是 $n$ 阶方阵, $\lambda$ 为实数
① $A^T|=|A|$
② $|\lambda A|=\lambda^n|A|$
③ $∣ A B ∣ = ∣ A ∣∣ B ∣$

伴随矩阵
行列式 $∣ A ∣$ 的各个元素的代数余子式 $A_{ij}$ 所构成的如下的矩阵

$A^* = \begin{Bmatrix} {A_{11} } & {A_{21} } & \cdots & {A_{n1}}\\ {A_{12}} & {A_{22}} & \cdots &{A_{n2}} \\ \vdots & \vdots & &\vdots \\ {A_{1n}} & {A_{2n} } & \cdots & {A_{nn}} \end{Bmatrix}$

称为 $A$ 的伴随矩阵，简称伴随阵
$AA^*=A*A=|A|E$

行列式的计算

行列式性质：

如果方阵的行或列向量线性相关，则其行列式为0。
行列式的绝对值可以衡量矩阵的“尺度”或“体积”。
对于可逆矩阵，其行列式非零。

方阵的行列式在求解线性方程组、计算矩阵的逆、以及多变量微积分等领域有重要应用。行列式的值可以反映一个线性变换的某些特性，如伸缩因子等。

行列式的计算方法有多种，包括：

拉普拉斯展开
三角化（高斯消元法）
对角线法则（萨鲁斯法则）

简单行列式计算：
1.二阶方阵
对于一个二阶方阵 $\left[ \begin{matrix} a & b\\ c & d\\ \end{matrix} \right]$
其行列式计算公式为
$d e t (A) = a d - b c$

2.三阶方阵
对于一个三阶方阵
$\left[ \begin{matrix} a_{11} & a_{12}& a_{13}\\ a_{21} & a_{22}& a_{23}\\ a_{31} & a_{32}& a_{33}\\ \end{matrix} \right]$
其行列式可以通过萨鲁斯法则（Sarrus’ rule）计算
$det(A)=a_{11}(a_{22}a_{33}-a_{23}a_{32})-a_{12}(a_{21}a_{33}-a_{23}a_{31})+a_{13}(a_{21}a_{32}-a_{22}a_{31})$

3.高阶方阵
对于更高阶的方阵，计算行列式通常使用如下方法：

a.拉普拉斯展开
行列式可以通过拉普拉斯展开来计算，即对于方阵 $A=[a_{ij}]n*n，$ 其行列式可以表示为：
$det(A)=\sum_{j=1}^n(-1)^{i+j}a_{ij}.det(A_{ij})$
其中， $A_{ij}$ 是去掉第 $i$ 行和第 $j$ 列后剩余的 $(n - 1) * (n - 1)$ 阶子方阵的行列式。

b.高斯消元法
将方阵通过行变换化为上三角形或下三角形，然后计算对角线上元素的乘积。因为行列式的值在行变换下不变，所以这种方法可以简化计算。

c.特征值
对于某些特定的矩阵，还可以通过计算特征值来求解行列式。如果 $A$ 的所有 $n$ 个特征值
$\lambda 1,\lambda 2,...,\lambda n$ 已知，则 $A$ 的行列式为这些特征值的乘积：
$det(A)=\lambda 1 *\lambda 2*...*\lambda n$

三、逆矩阵

对于 $n$ 阶矩阵 $A$ ,如果有一个 $n$ 阶矩阵 $B$ ,使得
$A B = B A = E$
则说明矩阵 $A$ 是可逆的，并把矩阵 $B$ 称为 $A$ 的逆矩阵，简称逆阵。
如果矩阵 $A$ 是可逆的，那么 $A$ 的逆矩阵是唯一的
$A$ 的逆矩阵记作 $A^{-1}$ ,即若 $A B = B A = E$ ，则 $B=A^{-1}$

①若矩阵 $A$ 可逆，则 $|A|\neq0$
②若 $|A|\neq0$ ，则矩阵 $A$ 可逆，且 $A^{-1}=\frac{1}{|A|} A^*$ , 其中 $A^*$ 为 $A$ 的伴随矩阵

矩阵可逆的条件
当 $∣ A ∣ = 0$ 时， $A$ 称为奇异矩阵，否则称为非奇异矩阵。
$A$ 是可逆矩阵的充分必要条件是 $|A|\neq0$ ，即可逆矩阵就是非奇异矩阵
若 $A B = E 或 B A = E$ ，则 $B=A^{-1}$

逆矩阵的运算规律
①若 $A$ 可逆，则 $A^{-1}$ 亦可逆，且 $A^{-1})^{-1}=A$
②若 $A$ 可逆，数 $\lambda\neq0$ ,则 $\lambda A$ 亦可逆，且 $(\lambda A)^{-1}=\frac{1}{\lambda} A^{-1}$
③若 $A 、 B$ 为同阶矩阵且均可逆，则 $A B$ 亦可逆，且 $AB)^{-1}=B^{-1}A^{-1}$
④若 $A$ 可逆，则 $A^{T}$ 亦可逆，且 $A^{T})^{-1}=(A^{-1})^T$

四、矩阵的特征值

矩阵的特征值是一个标量，它描述了矩阵作用于特定非零向量时，该向量方向上的拉伸或压缩因子。具体来说，特征值有以下几个关键点：

定义：特征值是指对于一个 $n$ 阶方阵 $A$ ,如果存在一个非零向量 $X$ 和一个实数 $\lambda$ ,满足 $A$ 乘以 $X$ 等于 $\lambda$ 乘以 $X$ ，（即 $AX=\lambda X$ ）,那么 $\lambda$ 就成为矩阵 $A$ 的一个特征值。
物理意义：特征值反映了在特定的方向上，矩阵所代表的线性变换的效果。如果某个方向上的向量在变换后仅仅改变了长度（可能是伸长或缩短），而方向保持不变，那么这个长度的变化比例就是特征值。
特征向量：与特征值对应的非零向量x被称为特征向量。特征向量和特征值是成对出现的，特征向量指示了在空间中哪些方向上会发生这样的纯伸缩变换。
计算方法：特征值通常是通过求解特征方程得到的，特征方程可以表示为 $|A-\lambda I|=0$ ,其中 $I$ 是单位矩阵， $∣∣$ 表示行列式。解这个方程可以得到矩阵A的所有特征值。
应用：特征值在多个领域都有广泛的应用，例如在信号处理中用于分析系统的稳定性，在图像处理中用于图像识别和分类，以及在机器学习中用于数据的降维等。