1.1 矩阵乘法介绍

醒过来摸鱼

已于 2023-01-26 14:14:23 修改

阅读量1k

点赞数

分类专栏：线性代数【更新中】文章标签：矩阵线性代数

于 2022-12-30 17:53:12 首次发布

本文链接：https://blog.csdn.net/m0_66201040/article/details/128497423

版权

线性代数【更新中】专栏收录该内容

71 篇文章

订阅专栏

文章目录

矩阵乘法的定义
线性方程组
线性变换
线性组合
python实现

矩阵乘法的定义

矩阵乘法的定义要求相乘的两个矩阵A和B，A的列必须等于B的行，结果为一个矩阵C。C的每个元素是A的行和B的列对应元素的乘积的和，也就是他们的标准内积（标准内积还没学到，可以点这个链接看看）。用数学语言描述就是：
$A^{m\times n}=\begin{pmatrix}a_{11} & \cdots & a_{1n}\\ \vdots & \ddots & \vdots\\ a_{m1} & \cdots & a_{mn} \end{pmatrix}\\ B^{n\times p}=\begin{pmatrix} b_{11} & \cdots & b_{1p}\\ \vdots & \ddots & \vdots\\ b_{n1} & \cdots & b_{np} \end{pmatrix}\\ C^{m\times p}=\begin{pmatrix} \sum_{k=0}^{n} a_{1k}b_{k1} & \cdots & \sum_{k=0}^{n} a_{1k}b_{kp} \\ \vdots & \ddots & \vdots\\ \sum_{k=0}^{n} a_{mk}b_{k1} & \cdots & \sum_{k=0}^{n} a_{mk}b_{kp} \end{pmatrix}$
结果C的任意一个元素是这样计算出来的：
$c_{ij}=\sum_{k=0}^{n} a_{ik}b_{kj}$
矩阵乘法有很多意义，但是我只写三种：一、线性方程组；二、线性变换；三、线性组合。因为这三种对于初学者来说，比较容易理解。

线性方程组

线性方程组可以看作矩阵与向量的乘积，比如下列线性方程组：
$5x+3y+2x=10\\ -x+4y+6z=-10\\ -2x-3y-4z=9$
可以表示为矩阵和一个未知向量相乘：
$\begin{pmatrix} 5 & 3 & 2\\ -1 & 4 & 6 \\ -2 & -3 & -4 \end{pmatrix}x=\begin{pmatrix} 10\\ -10\\ 9 \end{pmatrix}\\ x=\begin{pmatrix} \frac{19}8\\ \frac{7}8\\ -\frac{9}4 \end{pmatrix}$

线性变换

至于什么样的变换才能叫线性变换，这个是纯代数的问题，比较难，我这里就不过多讲了，但是行变换是一个线性变换，我举过例子，那么多个行变换就可以通过乘法组合起来，这点在后续的矩阵的LU分解中特别重要！尤其是多个线性变换先后作用，可以连乘起来，组成一个线性变换，比如下列行变换：
$x_1= \begin{pmatrix} 1 & 0 & 0 & 0\\ 2 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \end{pmatrix}\\ x_2= \begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 2 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \end{pmatrix}$
$x_1$ 的作用是把第一行乘以两倍加到第二行， $x_2$ 的作用是把第一行乘以两倍加到第三行，那么先后进行这两种作用就是 $x_1x_2$ ，把这两个矩阵乘起来使用就行了。
$x_1x_2=\begin{pmatrix} 1 & 0 & 0 & 0\\ 2 & 1 & 0 & 0\\ 2 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \end{pmatrix}$
这个乘完的矩阵会把矩阵第一行乘以两倍，加到第二行和第三行。利用矩阵乘法，可以把多个线性变换组合起来，节省了大量计算量。

线性组合

线性组合在几何空间里用得特别多。比如一个向量的坐标是 $(1, 1, 1)$ ，那么就可以看成是自然基和 $1,1,1)^T$ 这个向量的乘法，于是有：
$\begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix}\begin{pmatrix} 1\\ 1 \\ 1 \end{pmatrix}=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}$
标准坐标系，计算没什么意义，假如坐标系换了呢？比如说坐标系换成了这样：
$x_1=\begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, x_2=\begin{pmatrix} 1 \\ 2 \\ 0 \end{pmatrix}, x_3=\begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}$
那么其实就是要求三个比例 $\alpha_1,\alpha_2,\alpha_3$ 组成一个线性组合,使得下式成立：
$\alpha_1\begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}+\alpha_2 \begin{pmatrix} 1 \\ 2\\ 0 \end{pmatrix}+ \alpha_3\begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}$
其实也可以转为矩阵乘法，就是：
$\begin{pmatrix} 1 & 1 & 1\\ 0 & 2 & 2\\ 0 & 0 & 3 \end{pmatrix}\begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \alpha_3 \end{pmatrix}=\begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}\\ \alpha_1=\frac12,\alpha_2=\frac16,\alpha_3=\frac13$

python实现

按照定义实现就是这样：

    def __mul__(self, other):
        if isinstance(other, sympy.Expr):
            return Matrix([[sympy.simplify(e * other) for e in line] for line in self.__lines])
        columns = len(self.__lines)
        rows = len(other.__lines[0])
        if columns != rows:
            raise Exception("矩阵A列数%d != 矩阵B的行数%d" % (columns, rows))
        # 弄一个m行p列的新矩阵
        m = len(self.__lines[0])
        n = columns
        p = len(other.__lines)

        result = [[0] * m for _ in range(0, p)]
        # i 代表 A矩阵的行
        for i in range(0, m):
            # j 代表 B 矩阵的列
            for j in range(0, p):
                # 第一个矩阵的行 与第二个矩阵列的乘积和
                # k 代表 A矩阵的列和B矩阵的行
                for k in range(0, n):
                    mul = self.__lines[k][i] * other.__lines[j][k]
                    result[j][i] += mul
                if not isinstance(result[j][i], complex):
                    result[j][i] = round(result[j][i], 2)
        return Matrix(result)