svm分类算法
介绍
support Vector Machine (支持向量机) 是一个监督学习算法,既可以用于分类(主要)也可以用于回归问题。SVM算法中,我们将数据绘制在n维空间中(n代表数据的特征数),然后查找可以将数据分成两类的超平面。支持向量指的是观察的样本在n为空间中的坐标,SVM是将样本分成两类的最佳超平面。
将两类点分开,svm将会寻找可以区分两个类别并且能使间隔(margin)最大的划分超平面,margin是两个虚线到超平面的距离之和,margin越大,鲁棒性越强
当在二维平面上遇到不好分类的情况,就转化到更高的维度上来分类,在高纬度上找超平面,
从低纬度到高纬度上,计算复杂,需要一定的计算能力,我们可以通过核技巧来达到相似的效果而不需要向高纬度转化。
核函数具有将低维数据转化成高维数据的作用,从而具有将线性不可分问题转化为线性可分问题的作用。
原理
划分超平面可以定义为一个线性方程 : w T X + b = 0 w T X