支持向量机器—SMO算法

最新推荐文章于 2024-06-22 10:10:16 发布

VariableX

最新推荐文章于 2024-06-22 10:10:16 发布

阅读量385

点赞数 1

分类专栏：机器学习基础文章标签：机器学习 svm smo算法

本文链接：https://blog.csdn.net/VariableX/article/details/105940332

版权

文章目录

引入SMO的背景
两个变量二次规划求解方法
选择两个变量的方法
SMO算法
参考文章：

引入SMO的背景

前面的文章提到，SVM的学习问题可以转成下面的凸二次规划的对偶问题：
$\min\limits_{\alpha} \;\; \frac{1}{2}\sum\limits_{i=1}^{N}\sum\limits_{j=1}^{N}\alpha_i\alpha_jy_iy_jK(x_i,x_j) - \sum\limits_{i=1}^{N}\alpha_i\\ s.t. \; \sum\limits_{i=1}^{N}\alpha_iy_i = 0 \\ 0 \leq \alpha_i \leq C$
上面的式子是关于 $\alpha_i, i=1,2,...N$ 的函数，由于一个 $\alpha_i$ 对应一个样本，所以变量的个数等于样本的个数。在样本众多的情况下，直接对所有的变量1求全局最优解，计算量太大。

为解决这个问，可以使用序列最小最优化(SMO)算法，基本思路为：如果所有变量的解都满足KKT条件，那么就得到了最优化的解(因为KKT条件是该问题最优化问题的充要条件)。如果不满足KKT条件，那么选择两个 $\alpha_i, \alpha_j$ 作为变量，其他的作为常量，然后对这两个变量进行优化，那么优化的结果应该更接近KKT条件。整个SMO算法包括两个部分：

求两个变量的解析解
选择变量的启发式方法

两个变量二次规划求解方法

先假设我们已经按照某种方法选择了两个变量 $\alpha_1,\alpha_2$ ，其他变量 $\alpha_i(i=3,4\ldots,N)$ 可以视为常量，在优化函数中可以舍去。于是优化函数可以写成：
$\begin{aligned} \min_{\alpha_1,\alpha_2} W(\alpha_1,\alpha_2)=&\frac{1}{2}K_{11}\alpha_1^2+\frac{1}{2}K_{22}\alpha_2^2+y_1y_2K_{12}\alpha_1\alpha_2\\ &-(\alpha_1+\alpha_2)+y_1\alpha_1\sum_{i=3}^Ny_i\alpha_iK_{il}+y_2\alpha_2\sum_{i=3}^Ny_i\alpha_iK_{i2}\\ s.t. \ \ \ &\alpha_1y_1+\alpha_2y_2=-\sum_{i=3}^Ny_i\alpha_i=\varsigma\\ &0\leqslant\alpha_i\leqslant C, i=1,2 \end{aligned}$
式子中 $K_{ij}=K(x_i,x_j),\varsigma$ 是常数。约束条件为一个不等式约束和一个等式约束。

根据约束条件： $\alpha_1y_1+\alpha_2y_2=\varsigma=k，0\leqslant\alpha_i\leqslant C$ ，其中 $y_i \in \{-1, 1\}$ ，可以知道 $(\alpha_1,\alpha_2)$ 在平行于盒子 $[0,C]\times [0,C]$ 的对角线的线段上。根据不同的 $y_1, y_2$ 的取值，函数图像如下图所示：

在这里插入图片描述

假设原始问题的初始可行解为 $\alpha_1^{old},\alpha_2^{old}$ ，本次迭代的最优解为 $\alpha_1^{new},\alpha_2^{new}$ ，假设沿着约束方向 $\alpha_2$ 未经剪辑(未考虑不等式约束)的解是 $\alpha_2^{new,unc}$ 。

由于约束边界的存在，实际上有：
$\leq \alpha_2^{new} \leq H$
其中，L为线段下端点，H为上端点，具体的：

当 $y_1 \neq y_2$ 时，如上图(a)，则：
$\alpha_2^{old}-\alpha_1^{old}) \;\;\;H = min(C, C+\alpha_2^{old}-\alpha_1^{old})$
当 $y_1 = y_2$ 时，如上图(b)，则：
$\alpha_2^{old}+\alpha_1^{old}-C) \;\;\; H = min(C, \alpha_2^{old}+\alpha_1^{old})$