大白话SVM支持向量机：三天从入门到入坟(史上最详细推导)

SYSU-GodRain

于 2019-11-26 13:59:41 发布

阅读量467

点赞数 1

文章标签：机器学习、支持向量机、SVM、KKT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43346513/article/details/103248636

版权

本文详细介绍了支持向量机（SVM）的基本原理，包括其核心思想、硬间隔与软间隔的概念，以及如何通过拉格朗日对偶问题求解SVM。此外，还探讨了SVM的核技巧，展示了如何利用非线性变换解决非线性分类问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

支持向量机

支持向量机（SVM）是一种用于解决二分类问题的模型，与之前所有的模型相比，它要复杂得多。原因在于它涉及到的理论涵盖凸优化理论、对偶理论与核技巧等。最初，SVM适用于线性可分的数据集，但是引入了核函数后，它也能被用于线性不可分的情形。本质上，SVM是一个二次规划问题，现有的许多软件都可以用于求解，但考虑到效率问题，实际求解过程中运用的是John Platt提出的SMO算法。在深度学习出现之前，SVM被认为是效果最好、最强大的模型。

SVM的核心思想

SVM的目标还是在于寻找一个超平面，将两种不同类别的数据分开。但SVM与其他模型不同的是，样本的正例和负例分别用1和-1标记，而不是1和0，这种标记方式是SVM比较特殊的地方，对于推导过程至关重要。我们需要解决如下一个二分类的问题。

这个数据集是线性可分的，在二维空间中超平面退化为1条直线。我们给出了2种能将数据分开的超平面，如下。

显然，能够将这个数据集分开的超平面有无限多个，那么我们自然就要问一个问题：在这些超平面中，是否存在一个最好的超平面？SVM解决的正是这个问题，它能够在所有超平面中求解出一个最好的超平面。我们如何定义一个超平面有多“好”呢？好的超平面需要具备一定的鲁棒性。

实线代表分割超平面，圈出来的2个数据点就是支持向量。SVM认为，分割超平面应能将数据尽可能的分开，也就是数据点要离超平面足够远（两条虚线与分割超平面之间的距离），这样就能容忍更多的离群点，提高模型的鲁棒性。

硬间隔SVM

分割超平面可以写为，我们在分割超平面两边新增加两个超平面（图中的虚线）用以度量分割的间隔。它们总是可以写为和。我们不妨假设分割超平面为，上下平移后后，得到和，这三个平面两边同时除以得到：

再令

就得到：

我们的目标是让这三个超平面之间的间隔尽可能大，同时要保证没有数据点落在间隔之间。我们定义与的间隔为，则与的间隔也为。因此我们只需要最大化，同时保证所有数据点距离的距离大于即可。

如上图所示

位于与上，且向量与的法向量平行，即与之间的夹角为0。则它们的内积为：

同时

其中， )， )，则

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。