【机器学习笔记】SVM

最新推荐文章于 2022-07-30 18:36:05 发布

考研想喝奶茶

最新推荐文章于 2022-07-30 18:36:05 发布

阅读量878

点赞数 1

文章标签：机器学习支持向量机

本文链接：https://blog.csdn.net/qq_43557445/article/details/105134716

版权

本文深入探讨了支持向量机（SVM）的概念，从线性SVM的数学建模，包括超平面方程、分类间隔、约束条件，到拉格朗日函数和KKT条件，再到非线性SVM的核技巧。通过SMO算法解决对偶问题，并介绍了如何在Python的Scikit-learn库中构建SVM分类器。最后，文章提供了选择SVM还是Logistic回归的指导原则。

摘要由CSDN通过智能技术生成

本文学习自 https://zhuanlan.zhihu.com/ml-jack

SVM支持向量机

一、什么是SVM

对于一个分类问题，数据是线性可分的，也就是可以用一根棍子把两种小球分开，并且让小球距离棍子的距离最远，也就是要求最大间隔。
在这里插入图片描述
但是，当数据不是线性可分的时候，就不能找到一根棍子来区分小球，这时候需要把小球映射到高维空间，然后找一张纸来分类。想要让数据映射到高维空间，就需要核函数（kernel），用于切分的平面就是超平面。
在这里插入图片描述

二、线性SVM

由于棍子的位置可以有很多个，为了分类效果最好，我们就要找最大间隔，也就是支持向量到超平面的距离之和最大，这样就能最大化的区分两个类别。

1、数学建模

（1）超平面方程

二维空间下的直线方程：y=ax+b
把y轴替换成x2，把x轴替换成x1：x2=ax1+b
移项得到：ax1-x2+b=0
将公式向量化，得到：
在这里插入图片描述
进一步向量化：

其中，
若在坐标系中画出，可以发现w是直线的法向量，y是直线的截距。

然后可以推广到n空间，公式依然没变，只是向量的维数增加到n维。
在这里插入图片描述

（2）分类间隔方程

在这里插入图片描述
间隔=2d，d就是点到直线的距离

扩展到多维的距离公式：

d就是“分类间隔”。||W||是W的二范数，表示所有元素的平方和，再开方。

（3）约束条件

有两个问题：

如何判断超平面将样本点正确分类？
如何找到支持向量（距离超平面最近的点）？

这就是约束条件，也就是变量d的取值范围受到了约束。

对于二维平面，对样本xi进行标记：
在这里插入图片描述
如果超平面方程能够正确分类样本点，就会满足下面的方程：

进一步，可以写成：

上述公式的解释就是，对于所有分类标签为1和-1样本点，它们到直线的距离都大于等于d(支持向量上的样本点到超平面的距离)
再将公式两边都除以d:
在这里插入图片描述
其中，

此时依然可以描述一条直线：

把wd和yd替换成w,y：

因此，我们可以找到一些超平面，使得对于所有样本点，满足：

这就是SVM最优化问题的约束条件。
也可以变为：