如何理解线性的SVM

最新推荐文章于 2024-10-02 23:40:03 发布

学AI不秃头

最新推荐文章于 2024-10-02 23:40:03 发布

阅读量51

点赞数

分类专栏：机器学习文章标签：支持向量机算法机器学习人工智能分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a1691125058/article/details/131772637

版权

机器学习专栏收录该内容

8 篇文章 1 订阅

订阅专栏

文章详细解释了支持向量机的基本原理，首先介绍了Hard-MarginSVM，强调寻找最大边距的超平面，通过拉格朗日乘数法转化成无约束问题并找到最优解。接着讨论了Soft-MarginSVM，允许数据有误分类的情况，通过损失函数和C参数来控制错误容忍度。

摘要由CSDN通过智能技术生成

如何理解支持向量机（support vector machines）？

一、Hard-Margin SVM

1、问题引入

假设一组数据，三个线性分类器分别给出了如下三条决策边界：

在这里插入图片描述

哪一根直线是最好的？

一般情况下我们会认为，L2较L1和L3更好，为什么？

假设，当有一个蓝色类别的测试数据，如果是L1的这种分法，那它就会把这个蓝色的点归回，紫色三角形那一类。对与L3同理会有这种情况。如图：

在这里插入图片描述

那如何使我们的模型在无数条线中确定一条如L2这种，分的完美，抗干扰性强的决策边界呢？

L2直线有什么特点？

在这里插入图片描述

换句话说就是b线之上的区域都是蓝色类别的地盘，a线下面的都是紫色类别的地盘。本着公平公正的原则，

类似于拔河，双方队伍中离绳子中点最近的那两个人，到中点的距离要一样。（可能是不恰当的比方）这样才不会使得算法有偏向于某一对的嫌疑！

拓展到高维：

对于二维的数据就是找一条线，三维数据要找的就变成面了。一般数据都是高维的，所以我们要求解的不是一条直线而是一个高维的超平面（hyperplane）

2、如何把几何条件转化为公式表达

把上面求 max d表示为：

max margin(W,b)

max margin(W,b)满足以下两个条件：

（1）离超平面最近的样本点到超平面的距离：margin(W,b)

数学回忆：

在这里插入图片描述
对应到超平面就是系数矩阵W，即W就是超平面的一个法向量

（2）超平面要能正确分类
在这里插入图片描述

所以令 WXi + b = 1可以得出：
在这里插入图片描述

合并条件1和上面的约束条件再进一步转化：
在这里插入图片描述

在约束条件下求最值，可以利用拉格朗日乘数法

是不是好像在哪学过？高数二

拉格朗日乘数法：

在这里插入图片描述

几何意义：

在这里插入图片描述

$\lambda$

**拓展到高维：**约束条件变成一个向量

在这里插入图片描述

通俗点理解就是，高维的约束就是一个超平面，即目标函数f(x)的约束是一个区域范围，

只有在高维空间中目标函数的某个梯度方向，刚好和某些约束条件的合梯度方向相反时，调整 $\lambda$

使得梯度抵消为0.

换句话说就是在约束条件的范围内，并不是所有的约束都能起作用，只有某些约束的梯度的合梯度

刚好和目标函数的某个取值的梯度方向相反。所以，这些起作用的约束的 $\lambda$ 才不为0，其他的其实都为0

优化问题：

在这里插入图片描述

这是一个带约束的原问题。通过拉格朗日函数的直观理解，我们可以把这个带约束的问题转化为一个无约束的原问题：

在这里插入图片描述

上面那个带约束的原问题其实就是在约束W，b的取值，不然W，b的取值使得1 - yi(wxi + b)>0 ! 根据上面的拉格朗日数乘就是说这些约束是不起作用的，我们把它过滤了。

而这个不带约束条件的问题，本质上也是在过滤不起作用的、无效的W，b的取值

所以，综上

在这里插入图片描述

对偶问题：

在这里插入图片描述

上面的无约束问题和它的对偶问题是强对偶关系，所以求它对偶问题的解相当于求它的解

在这里插入图片描述

求最小值----> 求偏导=0

在这里插入图片描述

由KKT条件求b的解
在这里插入图片描述
根据互补松弛条件：

在这里插入图片描述

这就是支持向量机，W，b的值取值仅和支持向量(xk,yk)有关

所以最终我们的超平面终于找到了：

在这里插入图片描述

二、Soft-Margin SVM

1、问题引入

在这里插入图片描述
当样本数据有一个点如上分布的化，就难以分开了，此时可以修改一下约束条件，来允许这种点情况的出现，允许他犯点小错。

用loss损失来量化这种错误：

原问题：
在这里插入图片描述

把loss加到原问题可以表示为：
在这里插入图片描述

C超参数用来调整允许犯多大的错

一般是如下表示：

在这里插入图片描述

2、软间隔

这就是软间隔，允许我们的决策边界有波动的空间来调整，容忍数据的分布
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

学AI不秃头 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。