介绍
支持向量机(SVM)是一种可用于分类和回归问题的监督学习算法,一般常用于分类问题。其基本思想是我们将数据集中的点在n维空间中表示出来,其中n表示数据中变量的个数。然后寻找一个超平面将其分成不同的类别。如下图所示:
工作原理
通常支持向量机采用超平面将数据进行分类,那么怎么确定一个正确的超平面来提高分类准确率呢?有以下几个步骤:
-
通常我们在判别超平面时的一个方法就是选择一个分类结果做好的平面。当有图中三个平面时,哪一个更加符合分类情况?显然是B。
-
那么当有下图三个平面都有较好的分类效果时,我们应该选择哪一个呢?
这个时候我们需要计算两类向量到超平面之间的距离之和,也称为“间隔”。取间隔最大的那个超平面即为我们需要的超平面。如下图我们选择C更适合。