机器学习（4）——SVM

最新推荐文章于 2024-08-27 22:32:28 发布

schedule list

最新推荐文章于 2024-08-27 22:32:28 发布

阅读量621

点赞数 1

分类专栏： 14周AI人工智能

本文链接：https://blog.csdn.net/weixin_41761357/article/details/110245073

版权

14周AI人工智能专栏收录该内容

33 篇文章 13 订阅

订阅专栏

在这里插入图片描述

支持向量机简介

支持向量机（support vector machines, SVM），属于监督学习，是一个二分类模型。
在这里插入图片描述
比如我们要对上图的点进行分类，划分的线可以有多种：
如何确定我们到底要找哪一条分界线呢？我们的解决思路是：尽可能的让分界面宽，把它想象成一条河，河的中间线作为我们最终想要的那条分界线：
在这里插入图片描述
&emsp综上所述，SVM的基本思想就是求解能够正确划分数据集的并且几何间隔最大的分离超平面

SVM推导

1.假定有数据集X1,X2……Xn，对应的标签有两类Y1=1,Y2=-1，分别对应class1，class2；
在这里插入图片描述

2.假设决策边界是一个线性可分的超平面：
在这里插入图片描述
对于决策边界，我们的约束条件是间隔尽可能的大而且分类效果要分的好。

显然，间隔也有很多种选择，我们要做的就是选择尽可能宽的间隔，可以看到上图的margin比下图的margin更大，我们选择large margin，这样模型犯错的几率会更小，鲁棒性也就更高。

3.支持向量

既然名字里提到了支持向量support vector，这又是个什么呢？既然我们要找边界，那么就会有确定边界的几个点，这些点在SVM中就是下图中红点所示的样本点：在这里插入图片描述
显然，虚线上的点到划分超平面的距离都是一样的，这几个点共同确定了超平面的位置，因此这几个点就是support vectors。

4.SVM的数学模型
既然我们知道支持向量确定超平面的位置，那么我们需要求支持向量到超平面的距离，让这个距离最小，就可以使margin尽可能宽。

假设分类的超平面为
（1）
在这里插入图片描述

两个平行的边界超平面分别为
（2）
在这里插入图片描述

首先，点到直线之间的距离计算公式如下：
（3）
![在这里插入图片描述](https://img-blog.csdnimg.cn/20201127203737595.png

假设超平面能将训练样本正确分类，对于（xi,yi）,有以下式子：
（4）

在这里插入图片描述
两个异类支持向量到超平面的距离之和也就是间隔为：
（5）

其实就是两条直线

之间的距离（两条平行直线之间的距离公式此处不在赘述）。

我们要求的是在分类效果尽可能好的情况下的最大间隔，表达成数学公式是这样的：
（6）
在这里插入图片描述
也就是，找到能满足（4）的约束条件的参数ω和b，使得（5）最大。
其中，

是统一（4）后的结果，怎么统一的呢？（4）中两个公式左右子式相乘如下：

把这两个公式写成统一的写法就对应了：

为了最大化间隔，仅需要最大化在这里插入图片描述
等价于最小化
所以（6）可以写作：
（7）

综上，我们就得到了SVM的数学模型公式。