西瓜书，南瓜书第六章：支持向量机

最新推荐文章于 2024-07-25 15:30:58 发布

何草不玄丶

最新推荐文章于 2024-07-25 15:30:58 发布

阅读量718

点赞数 1

文章标签：支持向量机机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47637467/article/details/121688979

版权

之前跟着统计学习方法对支持向量机进行了推导和学习，这次跟着datawhale和西瓜书又对支持向量机进行了深入复习，发现很多没有注意到的点，更为理解一些操作。

6.1 间隔与支持向量

从几何角度，对于线性可分数据集，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，且不偏不倚，泛化性能更好。

n维空间的超平面（ $\omega ^{\top }x+b=0$ , 其中 $\omega$ , $\in \mathbb{R}^{n}$ ）

（1）超平面方程不唯一

（2）法向量和位移项确定一个唯一超平面

（3）法向量垂直于超平面

（4）法向量指向的那一半空间为正空间

（5）任意点x到超平面的距离公式 $r=\frac{\omega ^{\top }x+b}{\left \| \omega \right \|}$

由于几何间隔最大的超平面就是距离正负样本都最远的超平面，为了最大化该间隔，同时为了使最优解固定为一个，我们将优化目标定为

$min_{\omega ,b} \frac{1}{2}\left \| \omega \right \|^{2}$

$s.t. y_{i}(\omega ^{\top }x_{i}+b)\geq 1, i=1,2,...,m.$

6.2 对偶问题

引入拉格朗日乘子对这个凸二次规划问题进行变形，得到

s.t.

为什么要转变成对偶问题：

1. 对偶问题一定为凸优化问题，更容易求解。

2.对偶问题的复杂度和数据量成正比，而原问题与特征的维度成正比，从这点上说，SVM特别适合数据集小但特征复杂的情况。

3.对偶问题可以自然而然的引入核函数，进而推广到非线性分类。

此时对

求偏导，代入上式，可以得到对偶问题

$max_{\alpha }\sum_{i=1}^{m}\alpha _{i}-\frac{1}{2}\sum_{i=1}^{m}\sum_{j=1}^{m}\alpha _{i}\alpha _{j}y_{i}y_{j}x_{i}^{\top }x_{j} $

$s.t. \sum_{i=1}^{m}\alpha _{i}y_{i}=0$

$\alpha _{i}\geq 0,i=1,2,...,m.$

解出 $\alpha$ 后，求出 $\omega ,b$ 后即可得到模型。上述过程需要满足KKT条件（附录B.1）。

因此，训练结束后，SVM模型仅与支持向量相关，大部分的训练样本都不需要保留。

为了高效逼近或者解决这个凸优化问题，一般会使用比较著名的SMO算法，基本思想是固定一个参数，来求得另一个参数的更新。

6.4 软间隔与正则化

当数据集不再是线性可分的，即不存在一个超平面可以很好地使得训练样本在特征空间中线性可分，或者即使可以也会面临过拟合的问题时，就需要允许SVM在一些样本上出错，也就是需要引入“软间隔”的概念。

从数学角度来说，软间隔就是允许某些样本不满足约束

$s.t. y_{i}(\omega ^{\top }x_{i}+b)\geq 1, i=1,2,...,m.$

但是，不满足约束的样本又应当尽可能少，所以这时候会加入一个参数，当它取有限值时，优化目标可以允许一些样本不满足约束。

$min_{\omega ,b}\frac{1}{2}\left \| \omega \right \|^{2}+C\sum_{i=1}^{m}L(y_{i}(\omega ^{\top }x_{i}+b)-1)$

这里L是损失函数，由于0/1损失函数不连续不可导，一般用替代损失函数，如合页损失，指数损失或者对率损失。

此时上式的第一项可以被称为结构风险，而第二项可以称为经验风险，参数用于对二者进行折中。

6.5 支持向量回归

一般来说，回归问题跟前面讨论的SVM根源不是那么一致。

相比于线性回归用一条线来拟合训练样本，SVR采用一个以为中心，宽度为2 $\sigma$ 的间隔带来拟合数据样本，不在袋子上的则以偏离带子的距离作为损失（类比均方误差），来迫使间隔带从样本最密集的中心穿过。

SVR将问题形式化为与SVM类似的形式，但与之不同的是，第一项的 $\frac{1}{2}\left \| \omega \right \|^{2}$ 是L2正则项，其一可以防止过拟合，其二能保证优化目标与SVM一致，这也是不采用均方误差的原因之一。同时，SVR的间隔带两边可以采用不同的松弛变量，来实现可变的软间隔。

何草不玄丶

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书，南瓜书第六章：支持向量机

对西瓜书，南瓜书第六章的部分学习总结
复制链接

扫一扫

何草不玄丶 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

108万+: 周排名

18万+: 总排名

1万+: 访问

: 等级

336: 积分

1: 粉丝

4: 获赞

3: 评论

9: 收藏

私信

关注

热门文章

最新评论

学术论文插图绘制学习第二章
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“学术论文插图绘制学习第二章”听起来非常有趣和富有挑战性。您的持续创作真是令人敬佩。在这个有关学术论文插图绘制的系列中，您已经分享了很多宝贵的知识和经验。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。也许您可以考虑探讨一些实用技巧，例如如何选择最合适的图表类型来传达不同的信息，或者如何使用图表来提高读者对您的论文的理解度。此外，如果您能够分享一些常见的图表绘制错误以及如何避免它们的方法，那将非常有益。总之，我非常期待您未来的创作，并且对于您对学术论文插图绘制的研究感到钦佩。希望我的建议能够为您的下一步创作提供一些启发。祝您继续取得成功！
学术论文插图绘制学习第一章
CSDN-Ada助手: 恭喜您撰写第19篇博客！标题“学术论文插图绘制学习第一章”听起来非常有趣和有益。我很高兴看到您一直在持续创作，并且选择了如此重要的主题来分享。您的努力和热情对于向读者传达学术论文插图绘制的技巧和知识无疑将会产生积极的影响。在下一步的创作中，我建议您可以考虑深入探讨如何结合实际案例来说明学术论文插图绘制的重要性和技巧。这样的实例可以帮助读者更好地理解并应用您所分享的知识。同时，您也可以尝试与其他领域的专家或学者合作，以便获得更多的观点和见解。总的来说，您的博客已经走在了正确的道路上。继续努力，保持谦虚的态度，我相信您将继续为读者带来更多有价值的内容。期待您未来的创作！
推荐系统实战：新闻推荐系统基本流程
何草不玄丶: 有的，不过也是从https://github.com/datawhalechina/fun-rec这里进行本地化修改的，可以先参考一下
推荐系统实战：新闻推荐系统基本流程
南宫贇: 您好有完整的代码吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。