第 6 章 支持向量机
分类学习的基本思想:基于训练集D,在样本空间中找到一个划分超平面,将不同类别的样本分开。
而支持向量机就是想要找到一个最“正中间”的划分超平面将不同类别的样本划分,也就是下图中加粗的那条线。因为这种情况下,该划分超平面产生的分类结果是最鲁棒的,对未知样本的泛化能力最强。
那么,首先来描述一下超平面:
如下图6.2所示,我们将距离超平面最近的这几个训练样本点,也就是使得上式(6.3)等号成立的点,称为“支持向量”(support vector)。其中两个异类支持向量到超平面的距离之和为称为“间隔”(margin)。
想要找到最大间隔,问题转化成找到式6.3中约束的参数w和b,使得γ最大。
为了最大化间隔,需要消化||w||^2.
这就是支持向量机的基本型。
接下来,使用拉格朗日乘子法来解决这个问题。
所有图片公式来自Datawhale。
待更新…