这篇博客我本来想花大力气来写的,写到一半时发现有人已经做了充足的工作,而且写的很完美,此处膜一下July的这篇《支持向量机通俗导论(理解SVM的三层境界)》本着不重复造轮子的思想(其实我写了不一定有他好),我简单介绍SVM和如何在sklearn中运用。
我们现在要学习另一种形式的监督机器学习和分类算法:支持向量机。支持向量机的目标是找到数据间的最佳分割边界。在二维空间中,你可以把它想象成分割数据集的最佳拟合线。在支持向量机中,其实我们是在处理向量空间,因此分离线实际上是一个分离的超平面。最好的分离超平面被定义为包含支持向量之间“最宽”边界的超平面。超平面也可以称为决策边界。最简单的表达方式是通过图片:
我们将从上述数据开始。前一篇博客我们使用了KNN算法对这个数据集进行分类,下面我们将使用svm对其进行分类.我们怎么算出最好的分割超平面呢?好吧,我们可以看这个: