SVM之对偶问题

最新推荐文章于 2024-05-26 00:23:34 发布

小白o11

最新推荐文章于 2024-05-26 00:23:34 发布

阅读量313

点赞数

前一篇SVM之问题形式化中将最大间隔分类器形式化为以下优化问题：

容易发现这是一个凸优化问题，而凸优化问题问题一般而言是满足Slater条件的（具体证明我也不懂），所以可以等价地求解其对偶问题。转而求解其对偶问题，是因为它的对偶问题有很好的形式（向量内积形式），可以为SVM很方便的引人核函数。关于对偶问题的基本概念在写在SVM之前——凸优化与对偶问题一文中已做粗略介绍。现在，写出以上优化问题的对偶形式。

首先，将（1）化为标准形式

构建拉格朗日函数：

令，则（2）的对偶问题可以写成

首先求出。是函数关于变量的最小值，且容易发现是关于的凸函数，所以可以直接求偏导数并令其为0得到解。

关于求偏导：

令其为0，得到

关于求偏导：

令其为0，得到

现在，将(5) 代回(3)，得到

再根据(6)，得到

这便求出了，而对偶问题是。加上约束条件，对偶问题就可以写成

其中约束是拉格朗日对偶问题本身的要求，约束代表的结果。

现在，对偶问题就得到了。对偶问题求解的结果是得到的取值。当得到解后，就可以根据解出。确定了分类超平面的方向，使得超平面有一个平移，根据最大间隔分类器的准则，最优超平面是穿过两类样本“最中间”的一个平面，所以并不难确定

确定后，分类器就确定了，就是超平面，对于新的输入样本，如果则判别它样本类别为1，否则判别它样本类别为-1。

现在不求解，而是将带入判别式中，得

上式将判别式写成了向量内积的形式，看似需要计算输入与所有训练样本的内积，但实际上还可以简化。

回顾写在SVM之前——凸优化与对偶问题一文提到的KKT条件，只有时才可能不为0。对应到现在的分类器：（注意这里的是优化问题形式化中的优化变量，不要与上文中的新输入样本混淆）。所以只有当时，对于的才可能不为0，那么(11)的计算实际上只需计算了部分训练样本与新输入样本的内积，这部分的训练样本称为支持向量，这也是SVM——支持向量机名字的来源。

考虑支持向量满足，所以，而正是样本函数间隔的定义，也就是说，支持向量就是函数间隔为1的样本，它们也是所有样本中函数间隔最小的样本。

上图标出来最优分类超平面（红色）和对于的函数间隔为1的样本（两条黑线上的样本），对左侧黑线上的支持向量有，对于右侧黑线上的支持向量有，根据KKT条件，这两个样本可以根据和找到，两个式子联立起来得到，与(10)的是一致的。其实从这里就可以看出，只需要一个样本就可以确定了，根据，就可以解出 , 和(10)比较直观的说明分类超平面穿过两类样本正中间而已。

现在，分类器的内容似乎已经完整了，但不要忘了，这都是在样本可分的情况下进行的，还没有考虑样本不可分的情况。

核函数在一定程度上解决了样本不可分问题，观察优化问题(9)和判别函数(11),其中都存在向量的内积形式，核函数正是在这上面做文章的。下一篇SVM之核函数将讨论这个问题。

小白o11

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM之对偶问题

前一篇SVM之问题形式化中将最大间隔分类器形式化为以下优化问题：(1){minw,b12∥w∥2s.t.yi(wTxi+b)≥1容易发现这是一个凸优化问题，而凸优化问题问题一般而言是满足Slater条件的（具体证明我也不懂），所以可以等价地求解其对偶问题。转而求解其对偶问题，是因为它的对偶问题有很好的形式（向量内积形式），可以为SVM很方便的引人核函数。关于对偶问题的基本概念在
复制链接

扫一扫