支持向量机 (Support Vector Machine, SVM) 是一类按监督学习 (supervised learning) 方式对数据进行二元分类 (binary classification) 的广义线性分类器 (generalized linear classifier), 其决策边界是对学习样本求解的最大边距超平面 (maximum-margin hyperplane)。
正文
概念
乍一看上面的内容很抽象,什么二元分类,最大边距超平面……下面让我们来剖析一下这些概念。
如果要对一些数据(比如说点)进行分类,我们可以构造一条直线简单的把数据分成两半。这条直线就叫做分隔超平面。
这个分隔超平面旁边的点到超平面的距离就是间距,离超平面最近的点就叫做支持向量。SVM 的算法原理就是找到一种分类方式,让支持向量到超平面的距离达到最大,因为这样就能很好的分类数据。
既然是要让间距达到最小,那么首先我们来看怎么计算间距。在二维空间里我们可以用