机器学习 | 期末复习问题总结

rookiexiong

已于 2024-01-10 20:18:11 修改

阅读量101

点赞数

分类专栏：机器学习文章标签：机器学习人工智能深度学习算法

于 2023-11-14 16:10:54 首次发布

本文链接：https://blog.csdn.net/m0_62249876/article/details/134401498

版权

10 篇文章 1 订阅

订阅专栏

期末复习问题总结

准备期末考试ing，遇到的问题觉得有意思就随手记录一下：

内积（Dot Product）是两个向量之间的一种运算。计算方法是将两个向量对应位置的元素相乘，然后将结果相加。机器学习中经常用于表示特征之间的关系、相似度或进行线性变换。

特征表示与权重的内积：

在线性模型中，特征向量 $\mathbf{x}$ 和权重向量 $\mathbf{w}$ 之间的内积表示了特征与权重的关系。例如，线性回归模型的预测可以表示为：

$y_{pred} = \mathbf{w} \cdot \mathbf{x} + b$

其中， $\cdot$ 表示内积。
相似度计算：

内积还可用于计算向量之间的相似度。例如，在文本处理中，可以使用内积计算两个词向量之间的相似度。设 $\mathbf{v}_1$ 和 $\mathbf{v}_2$ 分别是两个词的词向量，它们的相似度可以通过内积计算：

$y_{similar} = \mathbf{v}_1 \cdot \mathbf{v}_2$

如果相似度越大，表示两个词在语义上越相似。

卷积神经网络CNN、自注意力机制QKV其实都可以看做是相似度的比较

核函数的内积表达：

在支持向量机（SVM）等算法中，内积在核函数中扮演重要角色。例如，径向基函数（Radial Basis Function, RBF）核的内积表达为：

$K(\mathbf{x}_1, \mathbf{x}_2) = \exp\left(-\frac{\|\mathbf{x}_1 - \mathbf{x}_2\|^2}{2\sigma^2}\right)$

这里， $\|\mathbf{x}_1 - \mathbf{x}_2\|$ 表示向量之间的欧几里得距离。内积的形式使得核方法能够高效地在高维空间中进行非线性变换。

在低维空间中，一些样本可能因为特征之间的复杂关系而难以用一个线性的决策边界进行分类，即线性不可分。然而，通过将这些样本映射到高维空间，我们有可能找到一个在高维空间中的线性决策边界，使得原本线性不可分的样本在高维空间中变得线性可分。

低维空间中线性不可分的原因：
在低维空间中，当样本的类别无法通过一个线性决策边界完美地分隔开时，这可能是因为数据点在低维度下的分布形状不具备线性可分性。例如，对于某些非线性的数据分布，一条直线可能无法很好地划分两个类别。
高维空间中线性可分的原因：
通过将数据映射到高维空间，我们增加了特征的数量，从而提高了数据的表达能力。在高维空间中，数据点更有可能被一个超平面（线性决策边界的推广）分隔开。这是因为高维空间中，两个点之间的距离可能会更大，使得它们更容易被一个超平面分隔。

一种常见的升维方法是使用核技巧（Kernel Trick），其基本思想是不直接计算在高维空间中的映射，而是通过一个核函数（kernel function）来隐式表示这个映射，从而避免了在高维空间中的直接计算。

数学上，给定两个样本的特征向量 $\mathbf{x}_i$ 和 $\mathbf{x}_j$ ，它们在高维空间中的内积可以通过核函数 $K(\mathbf{x}_i, \mathbf{x}_j)$ 来表示：