支持向量机简介
支持向量机(SVM)是一种有监督的机器学习算法,既可以用于分类,也可以用于回归。然而,它主要用于分类问题。在这个算法中,我们将每个数据项绘制为n维空间中的一个点(其中n是您拥有的特征数),每个特征的值是特定坐标的值。然后,我们通过找到区分这两个类的超平面来执行分类(请看下面的快照)。
支持向量只是个体观察的坐标。支持向量机是分离这两个类(超平面/直线)的前沿。你可以看一下支持向量的定义和它在这里工作的一些例子。
SVM原理
在上面,我们已经习惯了用超平面分隔这两个类的过程。现在最迫切的问题是“我们如何识别正确的超平面?”别担心,没有你想的那么难!
识别正确的超平面(Scenario-1):这里我们有三个超平面(A, B, C),现在,识别正确的超平面来分类星星和圆。
您需要记住一个识别正确超平面的经验规则:“选择能更好地隔离两个类的超平面”。在这个场景中,超平面“B”出色地完成了这项工作。
识别正确的超平面(场景-2):在这里,我们有三个超平面(A、B和C),它们都能很好地分隔类。现在,我们如何识别正确的超平面?
在这里,最大化最近的数据点(任意类)和超平面之间的距离将帮助我们决定正确的超平面。这个距离称为边距。让我们看看下面的快照:
上面可以看到,超平面C的margin比A和b都要高,因此我们将正确的超平面命名为C。选择超平面margin更高的另一个原因是鲁棒性。如果我们选择的超平面具有低的边距,那么就有很大的可能出现误分类。
识别正确的超平面(场景-3):提示:使用上一节讨论的规则来识别正确的超平面