我是这样理解--SVM，不需要繁杂公式的那种！(附代码)

最新推荐文章于 2023-12-24 20:40:17 发布

mantchs

最新推荐文章于 2023-12-24 20:40:17 发布

阅读量747

点赞数 1

分类专栏： machine learning 文章标签： SVM 支持向量机机器学习 ML 算法

本文链接：https://blog.csdn.net/weixin_41510260/article/details/95524738

版权

文章目录

1. 讲讲SVM

1.1 一个关于SVM的童话故事

支持向量机（Support Vector Machine，SVM）是众多监督学习方法中十分出色的一种，几乎所有讲述经典机器学习方法的教材都会介绍。关于SVM，流传着一个关于天使与魔鬼的故事。

传说魔鬼和天使玩了一个游戏，魔鬼在桌上放了两种颜色的球。魔鬼让天使用一根木棍将它们分开。这对天使来说，似乎太容易了。天使不假思索地一摆，便完成了任务。魔鬼又加入了更多的球。随着球的增多，似乎有的球不能再被原来的木棍正确分开，如下图所示。

SVM实际上是在为天使找到木棒的最佳放置位置，使得两边的球都离分隔它们的木棒足够远。依照SVM为天使选择的木棒位置，魔鬼即使按刚才的方式继续加入新球，木棒也能很好地将两类不同的球分开。

看到天使已经很好地解决了用木棒线性分球的问题，魔鬼又给了天使一个新的挑战，如下图所示。

按照这种球的摆法，世界上貌似没有一根木棒可以将它们完美分开。但天使毕竟有法力，他一拍桌子，便让这些球飞到了空中，然后凭借念力抓起一张纸片，插在了两类球的中间。从魔鬼的角度看这些球，则像是被一条曲线完美的切开了。

后来，“无聊”的科学家们把这些球称为“数据”，把木棍称为“分类面”，找到最大间隔的木棒位置的过程称为“优化”，拍桌子让球飞到空中的念力叫“核映射”，在空中分隔球的纸片称为“分类超平面”。这便是SVM的童话故事。

1.2 理解SVM：第一层

支持向量机，因其英文名为support vector machine，故一般简称SVM，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。

**线性分类器：**给定一些数据点，它们分别属于两个不同的类，现在要找到一个线性分类器把这些数据分成两类。如果用x表示数据点，用y表示类别（y可以取1或者0，分别代表两个不同的类），一个线性分类器的学习目标便是要在n维的数据空间中找到一个超平面（hyper plane），这个超平面的方程可以表示为（ wT中的T代表转置）：

$w^Tx+b=0$

这里可以查看我之前的逻辑回归章节回顾：点击打开

这个超平面可以用分类函数 $f(x)=w^Tx+b$ 表示，当f(x) 等于0的时候，x便是位于超平面上的点，而f(x)大于0的点对应 y=1 的数据点，f(x)小于0的点对应y=-1的点，如下图所示：

1.2.1 函数间隔与几何间隔

在超平面wx+b=0确定的情况下，|wx+b|能够表示点x到距离超平面的远近，而通过观察wx+b的符号与类标记y的符号是否一致可判断分类是否正确，所以，可以用(y(w*x+b))的正负性来判定或表示分类的正确性。于此，我们便引出了函数间隔（functional margin）的概念。

函数间隔公式： $\gamma=y(w^Tx+b)=yf(x)$

而超平面(w，b)关于数据集T中所有样本点(xi，yi)的函数间隔最小值（其中，x是特征，y是结果标签，i表示第i个样本），便为超平面(w, b)关于训练数据集T的函数间隔：

$\gamma=min\gamma i(i=1,...n)$

但这样定义的函数间隔有问题，即如果成比例的改变w和b（如将它们改成2w和2b），则函数间隔的值f(x)却变成了原来的2倍（虽然此时超平面没有改变），所以只有函数间隔还远远不够。

几何间隔

事实上，我们可以对法向量w加些约束条件，从而引出真正定义点到超平面的距离–几何间隔（geometrical margin）的概念。假定对于一个点 x ，令其垂直投影到超平面上的对应点为 x0 ，w 是垂直于超平面的一个向量， $\gamma$

最低0.47元/天解锁文章

mantchs

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
我是这样理解--SVM，不需要繁杂公式的那种！(附代码)

文章目录1. 讲讲SVM1.1 一个关于SVM的童话故事1.2 理解SVM：第一层1.2.1 函数间隔与几何间隔1.2.2 最大间隔分类器的定义1.2.3 最大间隔损失函数Hinge loss1.3 深入SVM：第二层1.3.1 从线性可分到线性不可分1.3.2 核函数Kernel1.3.3 总结1.4 SVM的应用2. SVM的一些问题3. LR和SVM的联系与区别3.1 相同点3.2 不同点4...
复制链接

扫一扫