详读西瓜书第六章支持向量机

weixin_55064870

已于 2023-12-27 20:42:35 修改

阅读量407

点赞数 11

文章标签：支持向量机算法机器学习

于 2023-12-25 22:13:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55064870/article/details/135207955

版权

6.1 间隔与支持向量

在样本空间中划分超平面的线性方程： $w^{T}x+b=0$ （*）

其中w = (w1;w2;w3;w4;...;wd)为法向量，决定超平面的方向，b是位移项，决定了超平面与原点之间的距离。

可以用（w,b）来表示样本空间中的一个超平面。

样本空间中任一点到超平面的距离: $r=\frac{|w^{T}x+b|}{\left \| w \right \|}$

令y表示分类结果的正确与否。

若 $w^{T}x+b>0$ ,则表示分类正确。y = 1

若 $w^{T}x+b<0$ ,则表示分类错误。y = -1

不妨设当*>=1时，结果正确。*<=-1，结果错误。

则距离超平面最近的几个点使得上式的等号成立，我们称之为【支持向量】

两个异类支持向量到超平面的距离之和为 $\gamma =\frac{2}{\left \|w \right \|}$ 它就是【间隔】

为了最大化间隔，可以令 $\left \| w \right \|$ 尽可能的小。支持向量机的基本型？

6.2 对偶问题

主要是为了最大化间隔，为了求解式子 $min\frac{1}{2}\left \| w \right \|^{2}$

这是一个凸二次规划问题，使用拉格朗日乘子法。可以得到它的“对偶问题”。

列出拉格朗日函数，然后求偏导，得到对偶式，解方程，解出 $\alpha$ ，后面还涉及到二次规划问题，SMO算法，KKT条件又用了一系列的方法去求解等式里面的w，b。

6.3 核函数

在实际问题中，训练样本大概率不是线性可分的。对于这样的问题，可以将样本空间映射到一个更高维的特征空间。使得样本在这个特征空间内线性可分。比如将原来属于二维平面的样本空间，映射到三维空间，它也许就可以实现线性可分了。

若原始空间是有限维，即属性数有限，那么一定存在一个高维特征空间使得样本可分。

令 $\phi(x)$ 表示将x映射后的特征向量。那么在特征空间中划分超平面所对应的模型变为

$f(x) = w^{T}\phi (x) + b$

之后的计算，求参数过程与之前大同小异。但是涉及到一个问题：由于特征空间的维数可能很高，甚至可能是无穷维，因此直接计算 $\phi (x_{i})^{T}\phi (x_{j})$ 通常是困难的，为了避开这个障碍，可以设想这样一个函数：

$\kappa (x_{i},x_{j})=<\phi (x_{i}),\phi (x_{j})>=$ $\phi (x_{i})^{T}\phi (x_{j})$

即xi与xj在特征空间的内积等于它们在原始样本空间中通过函数 $\kappa ()$ 计算的结果。这样就不用再去计算高维特征空间的内积。此处的 $\kappa ()$ 就是核函数。

任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”的特征空间。

“核函数选择是支持向量机的最大变数”

核函数的线性组合、直积、函数还是核函数。

6.4 软间隔与正则化

现实任务中往往很难找到合适的核函数使训练集在特征空间中线性可分，即使找到了也可能是过拟合造成的。缓解该问题的方法：引入“软间隔”概念，允许支持向量机在一些样本上出错。

软间隔：支持向量机的形式允许某些样本不满足约束

硬间隔：支持向量机的形式要求所有样本均满足约束。

使用软间隔的话，优化目标的模型需要在原有基础上加一个损失函数。这个损失函数是0/1损失函数，它的数学性质不好，不利于研究。因此我们通常会做一个替代。常用如下三种函数：

这就是常用的软间隔支持向量机。

在此基础上引入“松弛变量”，每个样本都对应一个松弛变量，用以表征该样本不满足约束的程度。

接下来的处理与之前类似，是一个二次规划的问题。需要用到拉格朗日乘子法。转换成为一个对偶问题。

6.5 支持向量回归（SVR）

传统回归模型通常基于模型输出与真实值之间的差值来计算损失而SVR假设我们能容忍f(x)与y之间最多存在 $\varepsilon$ 的偏差。也就是说只有当f(x)与y之间的差距大于 $\varepsilon$ 时才去计算损失。

6.6 核方法

参考文献

周志华《机器学习》

谢文睿《机器学习公式详解》

哔哩哔哩吃瓜教程

weixin_55064870

关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_55064870 CSDN认证博客专家 CSDN认证企业博客

码龄4年

东北林业大学

7: 原创

149万+: 周排名

30万+: 总排名

2492: 访问

: 等级

126: 积分

36: 粉丝

52: 获赞

4: 评论

47: 收藏

私信

关注

热门文章

最新评论

详读西瓜书第六章支持向量机
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
西瓜书详读-第五章神经网络
CSDN-Ada助手: 恭喜作者发布了西瓜书详读系列的第五章，对神经网络进行了详细的解读。非常感谢作者的辛勤付出和分享，让我们能够从中受益。在下一步的创作中，建议作者可以结合实际案例或者应用场景，进一步深入探讨神经网络的应用和优化方法，让读者能够更好地将理论知识转化为实际技能。希望作者能够继续保持创作的热情，为大家带来更多有价值的内容。
西瓜书第四章决策树-详读-第一部分
CSDN-Ada助手: 恭喜作者发布了新的博客，对西瓜书第四章决策树进行了详细阅读和解读，这对于学习决策树算法的读者来说肯定是非常有帮助的。希望作者能够继续坚持创作，同时建议可以在下一篇博客中加入一些实际案例或者应用场景的分析，让读者更好地理解决策树算法的实际应用。期待作者更多精彩的分享！
西瓜书第三章线性模型阅读笔记
CSDN-Ada助手: 恭喜你写了第四篇博客！阅读你的西瓜书第三章线性模型的笔记让我收获颇丰。不过我觉得下一步可以尝试结合实际案例，深入探讨线性模型的应用和局限性，或者对比不同的线性模型算法，这样能让读者更加深入地理解和学习。希望你能继续坚持创作，期待你更多精彩的文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
第一章绪论学习笔记
CSDN-Ada助手: 很高兴看到你写了第二篇博客！你对学习笔记的概念进行了很好的总结和介绍。继续创作下去，你一定会越来越进步的。除了你在标题和摘要中提到的知识和技能，还有一些与机器学习相关的扩展知识和技能。例如，特征选择和降维技术可以帮助提高模型的性能和效率，交叉验证可以用于评估模型的泛化能力，集成学习可以通过结合多个模型来提高预测的准确性等等。这些都是非常有用的工具和方法，希望对你的学习有所帮助。继续保持努力，期待看到更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。