序列最小最优化（Sequential Minimal Optimization, SMO）算法的推导、理解

最新推荐文章于 2020-12-04 01:46:31 发布

热爱生活的菇凉

最新推荐文章于 2020-12-04 01:46:31 发布

阅读量1.2k

点赞数 1

分类专栏：常用理论文章标签：机器学习 smo算法

本文链接：https://blog.csdn.net/frx_bwcx/article/details/109181489

版权

常用理论专栏收录该内容

2 篇文章 1 订阅

订阅专栏

内容是自己做的 ppt 的截图，有需要的小伙伴可以去下载，也可以给我留言，看到会回复的。

文章目录

前言

1998 年，John Platt 提出了序列最小最优化算法 (SMO) 算法用于训练 SVM 分类器。SMO 算法是一种启发式算法，其基本思路是：一次迭代只优化两个变量而固定剩余的变量。
在这里插入图片描述
SMO 要解如下凸二次规划的对偶问题

其实就是训练 SVM 分类器

算法过程

在这里插入图片描述
精度 $\epsilon$ 指 KKT 条件的容错率 toler。
部分 KKT 条件：

比如第二个条件，不要求严格等于 1 ，在容错率范围内都是可以接收的。原文内容如下：

在这里插入图片描述
SMO 算法主要有两个部分组成：

选取两个 $\alpha$ 进行优化；
求解两个 $\alpha$ 的解析解。

先说第二个内容

求解 $\alpha$ 的解析解

子问题

假设选择的变量是 $\alpha_1,\alpha_2$ ，其余变量 $\alpha_i (i=3,\cdots,N)$ 是固定的，则 SMO 的最优化问题的子问题如下，其中 $K(x_{i},x{j})=K_{ij}$
在这里插入图片描述
首先分析约束条件，重新定义 $\alpha_2$ 的取值范围

取值范围

根据约束条件得到 $\alpha_2$ 的表达式，然后分情况讨论，并根据 $\alpha_1 \in [0,C]$ 进行放缩

在这里插入图片描述
还可以将约束条件用图形表示出来，也可以得到相同的结果

在这里插入图片描述

解析解

目标函数是含 $\alpha_1^{new},\alpha_2^{new}$ 两个变量的二次函数，为了方便求解，我们利用等式约束，将目标函数转化成只含 $\alpha_2^{new}$ 的函数，然后求极小值，并与之前求得的取值范围进行比较，确定 $\alpha_2^{new}$ 最终的表达式，最后根据等式约束也可以得到 $\alpha_1^{new}$ .