支持向量机分类
支持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。SVM使用训练实例的一个子集来表示决策边界,这个子集就是所谓的支持向量(support vector)。
原理
线性可分与线性不可分
在学习支持向量机之前,我们需要先了解什么的线性可分问题。线性分类问题是指,根据标签确定的数据在其空间中的分布,可以使用一条直线(或者平面,超平面)进行分割。如下图就是一个线性分类问题。
也存在着许多线性不可分的情况,例如下图所示
最大边缘超平面
在二维空间里,判断是否是线性可分的只要看能否用一条直线把两个类别的事物分隔开来。我们暂且称之为分隔器。当一个空间的维数大于3时,这样的分隔器被称为超平面。正式的定义为:超平面是n维欧氏空间中余维度等于一的线性子空间ÿ