机器学习，详解SVM软间隔与对偶问题

最新推荐文章于 2025-05-09 08:00:50 发布

TechFlow

最新推荐文章于 2025-05-09 08:00:50 发布

阅读量2.5k

点赞数 13

分类专栏：机器学习文章标签：机器学习支持向量机 python 算法

本文链接：https://blog.csdn.net/TechFlow/article/details/108484998

版权

本文是机器学习专题关于SVM的探讨，介绍了在数据非线性可分情况下引入软间隔的概念，通过松弛变量解决错误分类问题，并对模型进行了推导，最终转向对偶问题的讨论。文章强调了软间隔中的惩罚参数C的作用，以及支持向量在模型中的意义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天是机器学习专题的第34篇文章，我们继续来聊聊SVM模型。

我们在上一篇文章当中推导了SVM模型在硬间隔的原理以及公式，最后我们消去了所有的变量，只剩下了 $\alpha$ 。在硬间隔模型当中，样本是线性可分的，也就是说-1和1的类别可以找到一个平面将它完美分开。但是在实际当中，这样的情况几乎是不存在的。道理也很简单，完美是不存在的，总有些样本会出错。

那针对这样的问题我们应该怎么解决呢？

软间隔

在上文当中我们说了，在实际的场景当中，数据不可能是百分百线性可分的，即使真的能硬生生地找到这样的一个分隔平面区分开样本，那么也很有可能陷入过拟合当中，也是不值得追求的。

因此，我们需要对分类器的标准稍稍放松，允许部分样本出错。但是这就带来了一个问题，在硬间隔的场景当中，间隔就等于距离分隔平面最近的支持向量到分隔平面的距离。那么，在允许出错的情况下，这个间隔又该怎么算呢？

为了解决这个问题，我们需要对原本的公式进行变形，引入一个新的变量叫做松弛变量。松弛变量我们用希腊字母 $\xi$ 来表示，这个松弛变量允许我们适当放松 $y_i(\omega^T x_i + b) \ge 1$ 这个限制条件，我们将它变成 $y_i(\omega^T x_i + b) \ge 1-\xi_i$ 。