SVM （二）SVM理论基础

最新推荐文章于 2023-12-18 21:59:49 发布

FSilverBullet

最新推荐文章于 2023-12-18 21:59:49 发布

阅读量746

点赞数 1

分类专栏： SVM 机器学习文章标签： SVM

本文链接：https://blog.csdn.net/dongba335/article/details/80685617

版权

本文深入探讨了支持向量机（SVM）的理论基础，包括最大边距、拉格朗日乘数、优化目标、权重向量和决策函数等核心概念。通过一系列数学公式，阐述了SVM如何构建最优超平面以及如何处理边界样本。

摘要由CSDN通过智能技术生成

SVM的理论基础

上面我们讨论了关于 拉格朗日乘子法和KKT条件，下面我们讨论一下 SVM的一些基础概念。

我们从一个简单地二分类问题来看，给定 训练样本集合\( D =\{(x_1,y_1), (x_2,y_2),…, (x_m, y_m)\}, y_i \ \epsilon \ \{-1, +1\}\)如下图所示：

分类学习最基本的思想就是找到一个 超平面将不同的类别分开，因此我们希望找一个决策面使得两个类分开，那么决策面一般表示就是 \(W^T + b = 0\)，现在的问题是如何找对应的W和b使得分割效果最好，这里跟logistic分类问题一样，也是找权值。

在那里，我们使根据每一个样本的输出值和目标值得误差不断的调整权值W和b来求解。当然这种求解方式只是众多方式中的一种，那么SVM是怎么求最优的方式的呢？

这里我们反过来看，假设我们知道了结果，就是上面这样的分类线对应的权值W和b。那么我们会看到，在这两个类里面，是不是总能找到离这个线最近的点，像下面这样：

然后我们定义一下 离这条分类线的最近的点到这个分类面的距离分别为\(d_1\) 和 \(d_2\)，因此我们知道总的距离就是\(D = (d_1 + d_2\),所以SVM的策略是 先找最边上的点，然后再找这两个距离之和D， 然后求解D的最大值。于是我们找到了这样的一个分界面\(W^T + b = 0\)，那么做离它最近的两类点且平行于分类面，如上面的虚线所示。

W是这个超平面的法向量