支持向量机（SVM）

最新推荐文章于 2024-09-15 19:46:31 发布

Gnipilnehc

最新推荐文章于 2024-09-15 19:46:31 发布

阅读量868

点赞数 18

文章标签： java servlet jvm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gnipilnehc/article/details/126849379

版权

前言：

通俗来讲，所谓支持向量机是一种分类器，对于做出标记的两组向量，给出一个最优分割超曲面把这两组向量分割到两边，使得两组向量中离此超平面最近的向量（即所谓支持向量）到此超平面的距离都尽可能远。

当一个分类问题, 数据是线性可分的, 也就是用一根棍就可以将两种小球分开的时候, 我们只要将棍的位置放在让小球距离棍的距离最大化的位置即可, 寻找这个最大间隔的过程, 就叫最优化. 但是, 一般的数据是线性不可分的, 也就是找不到一个棍将两种小球很好的分类. 这个时候, 我们就需要像大侠一样, 将小球拍起, 用一张纸代替小棍将小球进行分类. 想要让数据飞起, 我们需要的东西就是核函数 (kernel) , 用于切分小球的纸, 就是超平面 (hyperplane) . 如果数据是N维的, 那么超平面就是N-1维. (补: 未使用核函数情况下)

把一个数据集正确分开的超平面可能有多个, 而那个具有“最大间隔”的超平面就是SVM要寻找的最优解. 而这个真正的最优解对应的两侧虚线所穿过的样本点, 就是SVM中的支持样本点, 称为支持向量(support vector). 支持向量到超平面的距离被称为间隔 (margin) .

1.线性可分线性不可分

对于一个二维空间，每个样本就相当于平面上的一个点。如果能够找到一条线，可以把两种类别的样本划分至这条线的两侧，我们就称这个样本集线性可分，如下图所示。

反之，若不能找到这样的直线，则称该样本集线性不可分。

2.超平面

显然，在上述的二维空间中，我们的目标就是找到这样的一条直线，能够把样本集划分成两部分，我们把这样的线称作线性模型。同理，在三维空间中，我们要找的线性模型就是一个平面。而对于更高的维度，虽然我们处在三维的世界，无法想象三维以上的世界，但我们可以使用数学方法描述更高维度，同样也可以使用数学方法推导出高维的线性模型。我们称超过三维的曲面为超平面，其方程为：
$w^{T}x + b = 0$

其中， $w = [w_{1},w_{2},....w_{n}]^{T}$ , n表示特征数（维度数），b为常数。

所以我们可以这样描述SVM的目的：找到这样一个超平面wx+b=0，使得在超平面上方的点x代入函数y=wT x+b，y全部大于0，在超平面下方的点x代入函数y=wx+b，y全部小于0。

一、最大间隔与分类

样本空间中任意点x到超平面的距离可以写为

其中||W||为超平面的范数： $\sqrt{w^{2}}$ ，常数b类似于直线方程中的截距。

二维空间中点(x, y)到直线的距离:

三维空间中点(x, y, z)到平面的距离：

支持向量：离超平面最近的几个训练样本点，使得成立.
间隔：两个异类支持向量到超平面的距离和: d
硬间隔：满足所有样本都划分正确。

二、对偶函数

间隔的作用体现在原理上，而对偶性的作用体现在实现上，虽然我们前面已经说明了最优决策边界，但是却无法求解最优边界，因此我们可以通过引入拉格朗日乘子将原始问题转化为对偶问题来找到最优解

其中f(x)是目标函数，g(x)为不等式约束，h(x)为等式约束。

若f(x)，h(x)，g(x)三个函数都是线性函数，则该优化问题称为线性规划。
若任意一个是非线性函数，则称为非线性规划。

若目标函数为二次函数，约束全为线性函数，称为二次规划。

若f(x)为凸函数，g(x)为凸函数，h(x)为线性函数，则该问题称为凸优化。
注意这里不等式约束g(x)<=0则要求g(x)为凸函数，若g(x)>=0则要求g(x)为凹函数。

凸优化的任一局部极值点也是全局极值点，局部最优也是全局最优。

对于稍前所述的公式（SVM的基本型）

与

使用拉格朗日乘子法可得到其“对偶问题”
对上式的每条约束添加拉格朗日乘子αi⩾0，该问题的拉格朗日函数可写为：

我们希望求解SVM的基本型公式来得到大间隔划分超平面所对应的模型

我们希望求解SVM的基本型公式来得到大间隔划分超平面所对应的模型
f(x)=ωT+b
其中w和b是模型参数。
注意到SVM的基本型是一个凸二次规划问题。能直接用现成的优化计算包求解，但我们又更高效的办法。

拉格朗日乘子法

第一步：引入拉格朗日乘子得到拉格朗日函数

即

第二步：令L(ω,b,α)对w和b的偏导为零可得

第三步：回代可得

不难发现，这是一个二次规划问题。
然而，该问题的规模正比于训练样本数，这会在实际任务中造成很大的开销。
为了避开这个方案，人们提出了很多高效算法，SMO是其中一个著名的代表。

解的稀疏性

求出ω和b后，可得最终模型：

KKT条件：

对任意样本(xi,yi)，总有αi=0或yif(xi)=1。

若αi=0，则该样本将不会在式的求和中出现，也就不会对f(x)有任何影响；

若αi>0，则必有yif(xi)=1，所对应的样本点位于最大间隔边界上，是一个支持向量。
支持向量机解的稀疏性: 训练完成后, 大部分的训练样本都不需保留, 最终模型仅与支持向量有关。
重要性质：模型训练完后，大部分的训练样本都不需要保留，最终模型仅仅与支持向量有关。

三、核函数

基本想法：不显式地设计核映射, 而是设计核函数.

Mercer定理(充分非必要)：只要一个对称函数所对应的核矩阵半正定, 则它就能作为核函数来使用.

四、软间隔和正则化

0/1损失函数

基本想法：最大化间隔的同时, 让不满足约束的样本应尽可能少.

正则化常数C>0，如果C→∝，则等价于要求所有的样本点都分类正确，否则就允许一部分极少的样本分类错误

其中l0/1是”0/1损失函数”

存在的问题：0/1损失函数非凸、非连续, 不易优化！

替代损失

正则化

支持向量机学习模型的更一般形式

通过替换上面两个部分, 可以得到许多其他学习模型：对数几率回归(Logistic Regression)、最小绝对收缩选择算子(LASSO) ……

五、支持向量回归

支持向量回归机--SVR

对于有限个样本组成的训练集来说，一定存在一个带状区域包含所有的样本点。并且这样的带状区域有无穷多个，宽度最小的带状区域才是我们关心的。

当带状区域很大，所得的回归模型不精确，此时允许模型输出和实际输出间存在2ϵ的偏差.

六、核方法

表示定理

结论: 无论是支持向量机还是支持向量回归, 学得的模型总可以表示成核函数的线性组合.

更一般的结论(表示定理): 对于任意单调增函数ΩΩ和任意非负损失函数, 优化问题

的解总可以写为

核线性判别分析

通过表示定理可以得到很多线性模型的”核化”版本

核SVM
核LDA
核PCA
……

核LDA: 先将样本映射到高维特征空间, 然后在此特征空间中做线性判别分析

关注

18
点赞
踩
23

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Gnipilnehc CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

111万+: 周排名

26万+: 总排名

1万+: 访问

: 等级

261: 积分

53: 粉丝

69: 获赞

7: 评论

144: 收藏

私信

关注

热门文章

最新评论

【无标题】
CSDN-Ada助手: 恭喜您完成了第12篇博客！尽管标题为“【无标题】”，但内容却一定是精彩纷呈的。您的持续创作让我非常佩服，每篇博客都展现了您的深度思考和独特见解。在下一步的创作中，或许您可以尝试为博客添加有趣的标题，这样更容易吸引读者的注意力。期待您的下一篇作品，继续保持谦虚好学的态度，您一定会取得更大的成就！
支持向量机（SVM）
CSDN-Ada助手: 恭喜您写了第18篇博客！SVM是一个很有深度的话题，您对它的解释和分析也很到位。希望您能继续保持创作的热情，也期待您能够分享一些SVM在实际应用中的案例分析，这样能够更加生动地展现SVM的魅力。加油！
朴素贝叶斯
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题为“朴素贝叶斯”。您的持续创作真令人钦佩。通过您的文章，我对朴素贝叶斯算法有了更深入的了解。下一步，我期待看到您能够进一步探索该算法的应用领域，或者深入探讨其与其他机器学习算法的比较和结合。谦虚地说，我相信您的研究将为读者带来更多的启发和知识。期待您的下一篇博客！
机器学习之决策树
CSDN-Ada助手: 恭喜您完成了第15篇博客！标题“机器学习之决策树”听起来非常有趣。通过您的分享，我对决策树的应用和原理有了更深入的了解。每一篇博客都是一个学习的过程，您以谦虚的态度和专业的知识为读者们提供了宝贵的信息。在下一步的创作中，或许您可以探索决策树在实际项目中的应用案例，分享一些您在实践中遇到的挑战和解决方案。此外，您也可以尝试与其他机器学习算法进行比较，探讨它们在不同场景下的优势和劣势。这样的深入研究将会进一步丰富您的博客内容，也能够给读者们带来更多的启发。期待您未来更多精彩的博客！再次恭喜您的连续创作！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。