数学表达式: 从恐惧到单挑 (3. 向量与矩阵)

最新推荐文章于 2023-09-13 16:13:21 发布

闵帆

最新推荐文章于 2023-09-13 16:13:21 发布

阅读量744

点赞数 2

分类专栏：数学表达式魔训文章标签：机器学习线性代数

本文链接：https://blog.csdn.net/minfanphd/article/details/119083087

版权

16 篇文章 29 订阅

订阅专栏

3. 向量与矩阵

一个 $m$ 维向量是 $m$ 维空间的一个点.
向量与集合的记法相同, 都可以用 \mathbf, \bm, 或 \boldsymbol.
$\mathbf{x} \in \mathbb{R}^m$ .
向量可记为 $\mathbf{x} = (x_1, x_2, \dots, x_m)$ 或 $\mathbf{x} = [x_1, x_2, \dots, x_m]$ , 但绝不可以使用花括号, 因为它表示无序的集合.
列向量 $\mathbf{x}^{\mathrm{T}} = (x_1, x_2, \dots, x_m)^{\mathrm{T}} = [x_1; x_2; \dots; x_m]$ . 这里使用了分号. 源码: \mathbf{x}^{\mathrm{T}} = (x_1, x_2, \dots, x_m)^{\mathrm{T} = [x_1; x_2; \dots; x_m]. 常有人把 \mathbf{x}^{\mathrm{T}} 中的 \mathrm{T} 写成 \top, 即 $\mathbf{x}^{\top}$ , 我认为这是错误的.
向量的内积 $\mathbf{a} \cdot \mathbf{b} = \mathbf{a} \mathbf{b}^\mathrm{T} = \sum_{i=1}^n a_i b_i$ . 源码: \mathbf{a} \cdot \mathbf{b} = \mathbf{a} \mathbf{b}^\mathrm{T} = \sum_{i=1}^n a_i b_i.
加权和 $\mathbf{x} \mathbf{w}^\mathrm{T} = \sum_{i=1}^n x_i w_i$ 在机器学习中广泛使用. 其中 $x_i$ 为对象的属性值 (如体温), $w_i$ 则为该属性的权重.

一个 $n$ 行 $m$ 列的矩阵可表示为 $\mathbf{X} \in \mathbb{R}^{n \times m}$ . 也就是说, 它是 $\times m$ 空间的一个点.
纯矩阵的方式应表示为 $\mathbf{X} = [x_{ij}]_{n \times m}$ . 以后可以看到, 表达为矩阵有些优势.
但机器学习通常希望 $\mathbf{X}$ 表示包括 $n$ 个实例, 每个实例使用 $m$ 个属性描述的数据集, 即 $\mathbf{X} = \{\mathbf{x}_i\}_{i = 1}^n = \{\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_n\}$ , 其中 $\mathbf{x}_i = [x_{i1}, x_{i2}, \dots, x_{im}]$ .
两种表示方式的优点都想要, 有点尴尬.
更多讨论见机器学习的数学基础 5: 数据集的混合表示法.
矩阵乘法
给定 $\times k$ 的矩阵 $\mathbf{A}$ 和 $\times n$ 的矩阵 $\mathbf{B}$ , 则 $\mathbf{C} = \mathbf{A} \mathbf{B}$ 是一个 $\times n$ 的矩阵.
矩阵乘法也是我们第一次用到三重循环的地方. 代码参见
日撸代码300行（01-10天，基本语法）第 8 天内容.

自己出数据, 做一个 $\times 2$ 与 $\times 4$ 的矩阵乘法.

关注