机器学习笔记05-矩阵基础知识_随机矩阵j是什么意思-CSDN博客

本文链接：https://blog.csdn.net/dycljj/article/details/111300342

前言

矩阵的相关操作在机器学习中很重要，为了给之后打下坚实的基础，在此对矩阵的基础知识进行总结学习。主要包括矩阵的四则运算（加减乘除）以及矩阵的转置与逆矩阵。

什么是矩阵

在数学中，矩阵（Matrix）是一个按照长方阵列排列的复数或实数集合，最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。直观解释就是由中括号包起来的一组二维数据，如下所示即就是一个2*2的矩阵。

$\left[\begin{array}{ll} 1 & 2 \\ 3 & 4 \end{array}\right]$

常见的表示方法
一般情况下，由大写字母（如：A、B）表示一个矩阵，此处用A来表示上述矩阵。则：

$A_{i j}即表示矩阵中的元素，其中i表示第i行，j表示第j列。$

$A_{1 1}$ 即表示A矩阵中第1行第1列的元素，即就是1； $A_{2 2}$ 即表示A矩阵中第2行第2列的元素，即就是4； $A_{3 2}$ 即表示A矩阵中第3行第2列的元素，结果发现是未定义的，因为A矩阵中不存在第3行，因此该结果是未定义的。所以在使用矩阵过程中，一定要避免出现未定义的情况。

此图像的alt属性为空；文件名为image-1.png

向量：向量是一种特殊的矩阵，因为它只有1列。可表示为 $n * 1$ 的矩阵。以下就是一个4*1的矩阵，也可称为4维向量。

$\left[\begin{array}{l} 5 \\ 6 \\ 7 \\ 8 \end{array}\right]$

说明：一般情况下，矩阵的下标都从1开始。除非特定情况或已经说明，矩阵的下标从0开始。

矩阵的加法/减法

矩阵和矩阵相加，首先要求两个矩阵必须是同一维度的。只有同维度的两个矩阵才能进行加法操作。比如矩阵A为32维，矩阵B为32维，此时两个矩阵可以相加；若B矩阵为2*3维，则两个矩阵不能相加。

方法：对应元素依次相加， $A_{1 1} + B_{1 1}，A_{1 2} + B_{1 2}......$ 。

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]， B = \left[\begin{array}{lll} 6 & 11 & 2 \\ 7 & 4 & 5 \end{array}\right]$

令矩阵 $C = A + B$ ，那么 $C$ 为：

$\left[\begin{array}{lll} 3+6 & 2+11 & 0+2 \\ 5+7 & 7+4 & 9+5 \end{array}\right] =\left[\begin{array}{lll} 9 & 13 & 2 \\ 12 & 11 & 14 \end{array}\right]$

矩阵的减法和加法一样，此处就不再赘述了。

矩阵和标量的乘法/除法

矩阵和标量相乘，即就是一个矩阵和数字相乘，可表示为 $k * A$ 或 $A * k$ ，其中 $k$ 为常数。这个很简单，就是用 $k$ 和矩阵中的所有元素相乘即可。

$\left[\begin{array}{ll} 1 & 2 \\ 3 & 4 \end{array}\right] =\left[\begin{array}{ll} 1 & 2 \\ 3 & 4 \end{array}\right] * 3 =\left[\begin{array}{ll} 1*3 & 2*3 \\ 3*3 & 4*3 \end{array}\right] =\left[\begin{array}{ll} 3 & 6 \\ 9 & 12 \end{array}\right]$

矩阵和标量的除法其实一样，即就是乘以这个标量的倒数。例如 $/ 3 ，就就是 * 1 / 3$ 。

矩阵和矩阵的乘法

两个矩阵相乘，必须满足以下规律：

第一个矩阵的列数 = 第二个矩阵的行数。
$\left[\begin{array}{lll} & & \\ & m*n & \\ & & \end{array}\right]* \left[\begin{array}{lll} & & \\ & n*k & \\ & & \end{array}\right]= \left[\begin{array}{lll} & & \\ & m*k & \\ & & \end{array}\right]$

其中第一个表示m行n列矩阵，第二个表示n行k列矩阵，则矩阵相乘得到m行k列矩阵。

方法说明：如下假设A为23维矩阵，B为33维矩阵，则我们可以知道，相乘以后的矩阵为23维，即C为23维矩阵。

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]， B = \left[\begin{array}{lll} 1 & 2 & 0 \\ 4 & 5 & 5 \\ 2 & 8 & 1 \end{array}\right]$

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]* \left[\begin{array}{lll} 1 & 2 & 0 \\ 4 & 5 & 5 \\ 2 & 8 & 1 \end{array}\right]$

分解步骤：

（1）首先将 $B$ 矩阵分解为3个3维向量，分别为 $B 1, B 2, B 3$ ，则：

$\left[\begin{array}{l} 1 \\ 4 \\ 2 \end{array}\right] B2 = \left[\begin{array}{l} 2 \\ 5 \\ 8 \end{array}\right] B3 = \left[\begin{array}{l} 0 \\ 5 \\ 1 \end{array}\right]$

（2）分别将A与 $B 1 ， B 2 ， B 3$ 相乘，注意顺序不能反：

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]* \left[\begin{array}{l} 1 \\ 4 \\ 2 \end{array}\right]= \left[\begin{array}{lll} 3*1+2*4+0*2 \\ 5*1+7*4+9*2 \\ \end{array}\right]= \left[\begin{array}{l} 11 \\ 51 \\ \end{array}\right]$

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]* \left[\begin{array}{l} 2 \\ 5 \\ 8 \end{array}\right]= \left[\begin{array}{lll} 3*2+2*5+0*8 \\ 5*2+7*5+9*8 \\ \end{array}\right]= \left[\begin{array}{l} 16 \\ 117 \\ \end{array}\right]$

$\left[\begin{array}{lll} 3 & 2 & 0 \\ 5 & 7 & 9 \end{array}\right]* \left[\begin{array}{l} 0 \\ 5 \\ 1 \end{array}\right]= \left[\begin{array}{lll} 3*0+2*5+0*1 \\ 5*0+7*5+9*1 \\ \end{array}\right]= \left[\begin{array}{l} 10 \\ 44 \\ \end{array}\right]$