机器学习-常用数学基础（一）_一维向量的全距-CSDN博客

本文链接：https://blog.csdn.net/CSBLOG/article/details/142212635

机器学习的数学基础 PART ONE

1. 标量 (Scalar)：

单个数据，如1,2,3,4。

2. 向量 (Vector)：

向量是一个有方向有大小的量，通常表示为由数值排列成的一维数组。

一维数组，将多个标量按照一定的顺序排列成一行或一列，如：[1,2,3,4]。

向量通常使用小写字母加粗体来表示，如x, a, b, v, u。

2.1 向量的长度

向量的长度叫模长，模长是一个映射，它把一个n维的向量变成了实数。

“模”字本身有标准、规范的意思。比如模型、模具这种词，就是一种标准的容器。而“范”字也有模子的意思，所以这两个字的选取都在表达这个数学概念，在测量一种东西。有个词叫“模范”，之前叫模长，现在叫范数。

3. 矩阵 (Matrix)：

二维数组，成行成列的一堆数据。矩阵通常使用大写、斜体、粗体表示，如A, B, V, X。

从数据的角度来看，矩阵可以表示为一个包含行和列的数据表，每个单元格中的数值可以代表某种测量结果、观察值或特征。比如鸢尾花iris的样本集中，每一行表示一个样本，150行表示有150个鸢尾花的样本；每一列表示一个特征，4列表示鸢尾花有4个特征，分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。

从统计学的角度来看，矩阵可以用于描述多个变量之间的关系。例如，协方差矩阵用于衡量变量之间的相关性，而相关矩阵则提供了变量之间的线性相关性度量。使用这些矩阵来推断模式、关联和依赖性，以及进行数据分析和建模。

从线性代数的角度来看，矩阵可以用于表示线性方程组的系数矩阵。通过矩阵运算，例如矩阵乘法、求逆和特征值分解，可以解决线性方程组、求解特征向量和特征值等问题。线性代数中的矩阵理论提供了处理线性关系的强大工具。

从几何学的角度来看，矩阵可以用于表示几何变换。通过将向量表示为矩阵的列或行，可以应用平移、旋转、缩放等几何变换。矩阵乘法用于组合多个变换，从而实现更复杂的几何操作。在计算机图形学和计算机视觉中，矩阵在处理和表示二维或三维对象的位置、方向和形状方面起着重要作用。

4. 张量 (Tensor)：

三维、四维、五维等高维数组。例如图像就属于三维的数组。

5. 范数：(Norm：size of a vector)：

衡量向量或矩阵大小的方法。

常见的范数是L1范数和L2范数。

L2范数也叫欧式距离。L2 Norm / Euclidean Distance

5.1 范数最常见的应用是：

（1）均方误差成本函数。真实值与预测值之间的平方差之和其实就是从真实值向量中减去预测值向量得到的结果向量的L2范数。

（2）正则化。在ridge回归中，我们对权重进行了约束。

5.2 范数的公式：

5.3 空间中两点的距离

6. 内积 / 点积

内积也称为点积。求点积就是将相应的坐标配对，求出每一对坐标的乘积，然后相加求和。

乘法相当于“缩放”，加法相当于“降维”。

7. 余弦定理

8. 余弦相似度 Cosine Similarity

余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1，而其他任何角度的余弦值都不大于1；并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时，余弦相似度的值为1；两个向量夹角为90°时，余弦相似度的值为0；两个向量指向完全相反的方向时，余弦相似度的值为-1。这结果是与向量的长度无关的，仅仅与向量的指向方向相关。余弦相似度通常用于正空间，因此给出的值为0到1之间。