机器学习教程之支持向量机：模型篇5–向量机的软间隔拓展

最新推荐文章于 2022-04-06 19:41:22 发布

Liangjun_Feng

最新推荐文章于 2022-04-06 19:41:22 发布

阅读量874

点赞数 1

分类专栏：机器学习教程文章标签：机器学习支持向量机软间隔 KKT SMO

本文为博主原创文章，转载请注明出处

本文链接：https://blog.csdn.net/liangjun_feng/article/details/79149924

版权

机器学习教程专栏收录该内容

29 篇文章 17 订阅

订阅专栏

支持向量机是机器学习领域里最强的几种分类器之一，被广泛的运用于各种分类回归问题，如果不考虑集成学习算法以及近几年出现的深度学习算法，支持向量机的性能可以说是在学习领域具有统治地位，在一些中小型的数据集上它的性能甚至能够超过一些深度学习网络。其基本原理相当简单，但是模型的求解和优化却十分复杂，很难描述清楚，这里我会一步一步，尽我所能分章节的将它总结完善

##模型篇
· 支持向量机：模型篇1–支持向量与间隔
· 支持向量机：模型篇2–支持向量的拉格朗日对偶
· 支持向量机：模型篇3–对偶问题的求解: SMO算法
· 支持向量机：模型篇4–核函数与非线性优化
· 支持向量机：模型篇5–向量机的软间隔拓展

##代码篇
· 支持向量机：代码篇1-基于CVXPT优化函数求解
· 支持向量机：代码篇2-基于SMO算法求解

在前面几篇博客的讨论中，我们将向量机从原始问题转换到了对偶问题，再使用高效的SMO算法求解，还引入了核函数将模型拓展到了非线性的情况。
在上一篇博客的结尾处，提到了一个问题，那就是核函数的具体形式我们其实是无法得知的，只能尝试一些备选的核函数，从中挑出相对较好的一个。其实，在现实任务中，就算选择了一个相对较好的核函数，也很难使得训练样本在特征空间中是完全线性可分的。缓解该问题的一个办法就是允许支持向量机在一些训练样本上出错，从而达到在测试样本上性能提升的目的。在训练集上，未引入软间隔到引入软间隔的训练集分类变化如下
这里写图片描述
第一篇博客中所说的，支持向量机的形式是要求所有训练样本均满足 $y_{i} (\mathbf{w^{T}}\mathbf{x}+b ) >=1$ ,即在训练时，所有的样本都必须划分正确，这称为“硬间隔“。而所谓的“软间隔“，就是允许训练样本在训练时某些样本不满足约束 $y_{i} (\mathbf{w^{T}}\mathbf{x}+b ) >=1$ ，当然，在最大化间隔时，不满足约束的样本应该尽可能的少，于是，支持向量机的原始优化目标可以重写为