SVM 支持向量机介绍与原理

最新推荐文章于 2024-07-28 14:43:36 发布

金甲虫Scarb

最新推荐文章于 2024-07-28 14:43:36 发布

阅读量1.3k

点赞数 3

分类专栏：数据挖掘文章标签： svm 数据挖掘

本文链接：https://blog.csdn.net/jjhfen00/article/details/71025643

版权

数据挖掘专栏收录该内容

1 篇文章 0 订阅

订阅专栏

SVM 支持向量机

By Scarb
数据挖掘课程的期末作业。学期末的时候太忙了，所以没有写博客发上来。隔了这么久终于想起来这个于是发一下。

SVM 支持向量机

1. 什么是支持向量机(SVM)

1.1 一个故事

在介绍SVM是什么之前，先来看一个故事……
我在网络上看到这个故事，通过它很快地理解了SVM的作用。
好吧，故事是这样子的：
在很久以前的情人节，大侠要去救他的爱人，但魔鬼和他玩了一个游戏。
魔鬼在桌子上似乎有规律放了两种颜色的球，说：“你用一根棍分开它们？要求：尽量在放更多球之后，仍然适用。”

SVM_1

于是大侠这样放了。

SVM_2

SVM就是试图把棍放在最佳位置，好让在棍的两边有尽可能大的间隙。
魔鬼看到大侠已经解决了一个难题，于是魔鬼给了大侠一个新的挑战；这也是SVM中另一个更加重要的难题：

SVM_3

现在，大侠没有棍可以很好帮他分开两种球了，现在怎么办呢？当然像所有武侠片中一样大侠桌子一拍，球飞到空中。然后，凭借大侠的轻功，大侠抓起一张纸，插到了两种球的中间。

SVM_4

现在，从魔鬼的角度看这些球，这些球看起来像是被一条曲线分开了。

SVM_5

再之后，无聊的大人们，把这些球叫做「数据」，把棍子叫做「分类器」, 找到最大间隙的方法叫做「最优化」，拍桌子叫做「核方法」, 那张纸叫做「超平面」。

1.2 SVM 是什么

看了上面这个故事，基本能理解SVM大致是做什么的。它的本质是一个线性分类器。
支持向量机是用来解决分类问题的，它找到一条线将两个特征划分开来，新的数据在线的哪边就可以直接把数据划分进这一类中。所以它是一种对现形和非线性数据进行分类的方法。
简单地说，SVM是一种算法，它使用一种非线性映射，把原训练数据映射到较高的维上（就是大侠用轻功把球打飞起来）。在新的维上，它搜搜最佳分离超平面（即插入一张纸）。使用到足够高维上的、合适的非线性映射，两个类的数据总可以被超平面分开。

2. SVM 的原理

2.1 数据线性可分的情况

2.1.1 超平面以及点到平面的距离

线性分类器用一个超平面 wx + b = 0 将空间划分为两个部分，wx + b > 0 和 wx + b < 0，w的方向和超平面方向垂直。

SVM_6

那么如何求空间上一点到这个超平面的距离呢？经过数学推导可以得到下面的结论

SVM_7

这个距离就等于g(x)的绝对值比w的模。所以原点到超平面的距离是b的绝对值比w的模。
这个结论在后面将会用到。

2.1.2 margin、Support Vecotrs 间隔和支持向量

超平面向上或者向下平移，直到遇到某一个点时停下。能够向上和向下平移距离的和就是margin（间隔）。而SVM就是要让这个超平面的margin最大。
Support Vecotrs（支持向量），就是超平面平移时最先遇到的点。这个名字比较形象，支持向量就好像它托着这个面一样。来看一张图：

SVM_8

在SVM中有一些新的定义：把分界面定为wx + b = 0，分界面的上边缘定为 wx + b = 1，分界面的下边缘定为 wx + b = -1。超过上边界的数据点记为1，超过下边界的数据点记为-1。
所以可以把SVM的问题转换成求最大margin的问题。那么margin如何得到？通过刚才得出的求某一点到分界面的公式可以得到计算margin的公式，如下图所示：

SVM_9