机器学习——支持向量机（SVM)

孤独之风。

已于 2022-06-13 21:16:40 修改

阅读量1.2k

点赞数 2

分类专栏：机器学习文章标签：机器学习支持向量机人工智能

于 2022-06-13 21:14:59 首次发布

本文链接：https://blog.csdn.net/qq_48961214/article/details/125267504

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

支持向量机（Support Vector Machine，SVM）是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线，它们之间的边距最大。为此，我们将数据项绘制为 n 维空间中的点，其中，n 是输入特征的数量。在此基础上，支持向量机找到一个最优边界，称为超平面（Hyperplane），它通过类标签将可能的输出进行最佳分离。

首先来了解一下什么是支持向量,下面举一个简单的例子。

如上图，对于一个二分类场景，可以有无数线将其分开。被虚线截到的一个或者多个样本就叫做支持向量。

1.1 线性可分的SVM

如果有一个线性函数能够将样本分开，就称这些数据样本是线性可分的。线性函数，简单说来，在二维空间中就是一条直线，三维空间中就是一个平面。高于三维，我们统称为 超平面。

关于上面图中存在的一个问题：就是可以有无数条直线将样本分开，所以需要找出一条可以正确分开样本并且结果是最优的。

最优化的原则就是所有的样本能正确分类并且不同样本之间的间隔要最大。转化为所有的支持向量到线性函数（超平面）的距离最大，这样就能保证最优结果，并且此结果下只可能有一条最优线将样本分开。

![在这里插入图片描述](https://img-blog.csdnimg.cn/c66bf52ef35c496eb85de79f7c9725dd.png#pic_center

接下来应该要怎样计算间隔呢？

用如下线性方程来描述超平面 W^Tx+b=0; 其中W为法向量，决定了超平面的方向，b为位移量，决定了超平面与原点的距离。假设对于样本（x_i,y_i),用y_i =+1来表示正样本，y_i =-1来表示负样本。（当然可以的+1，-1不是肯定的，你也可以取2，3，4… -2,-3,-4…).说明一下：y_i 是标签值。可以得到如下图结果：

通过放缩，可以使在支持向量x₀上有|w^Tx₀+b| = 1,而在非支持向量上有|w^Tx₀+b| >1.

所有有一个支持向量点x₀到超平面的距离：
$d=\frac{|wTx0+b|}{||w||} = \frac{1}{||w||}$