1.支持向量机(SVM)概述
(1)支持向量机(Support Vector Machines,SVM)是一种二元分类模型,它是一类模型的统称,其中包括:
①线性可分支持向量机;
②线性支持向量机;
③非线性支持向量机。
(2)核心思想:
训练阶段在特征空间中寻找一个超平面,它能(或尽量能)将训练样本中的正例和负例分离在它的两侧,预测时以该超平面作为决策边界判断输入实例的类别。寻找超平面的原则是,在可分离的情况下使超平面与数据集间隔最大化。
(3)支持向量机的分类示意图为:
支持向量机分类图示
简单来说,SVM的原理就是在平面内找到一条直线,使得这两类不同的样本点分开,并且保证能够尽可能远的远离这条直线。用向量表示两类样本点之间的分类间隔(Margin)为:
分类间隔
支持向量机的目的是使r最大,等价于使||w||/2最小。而几何向量使分类间隔最大问题可以转化为运筹学上的约束优化问题。因为涉及太多复杂公式,此处省略。
只要理解了SVM的原理,并且学会利用sklearn库调用SVM模块,就达到了数据分析的目的。
2.SVM算法实现sklearn.svm.SVC(C=1.0, kernel='rbf',