【机器学习】支持向量机（SVM）

HP-Patience

已于 2024-07-01 18:13:54 修改

阅读量677

点赞数 26

分类专栏：机器学习-西瓜书-学习笔记文章标签：支持向量机算法机器学习

于 2024-06-29 17:47:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_82023330/article/details/140067773

版权

机器学习-西瓜书-学习笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章目录

章节介绍
笔记介绍
数学知识
SVM-支持向量机
核函数
软间隔和正则化：
- 引入原因：
- 正则化思想：
支持向量回归
- 引入原因：
- 方法思想：

章节介绍

统计学领域名声赫赫的SVM与核方法是时至今日仍在高频使用的经典算法。

笔记介绍

对本章各节知识点进行汇总，主要分为引入原因，原理思想，和一些思考，对于数学推导内容介绍较少，有需要的可以先阅读西瓜书，再参考南瓜书的数学推导。

数学知识

大部分都是规划类、最优化的问题，最好先进行相关知识的学习。

这里推荐一本书：最优化：建模、算法与理论 (刘浩洋户将李勇锋文再文)

SVM-支持向量机

引入原因：

在线性可分的条件下，我们在训练集做分类任务时，最基本的想法就是在样本空间中找到一个超平面进行划分,
但是对于分类任务，我们可以画出很多个超平面，这时候就需要引入损失函数，对超平面进行选择，而使得两个异类支持向量的距离最大化，就是我们所说的支持向量机的基本型。

在这里插入图片描述

数学公式及其原理：

仍用线性模型来表示一个超平面：
$w ^ { T } x + b = 0$
而点到超平面的距离表示为：
参考点到直线距离公式即可理解
$\frac { | w ^ { T } x + b | } { | | w | | }$
两个异类支持向量到超平面的距离（称为间隔 margin）表示为：
参考平行直线间的距离公式即可理解
（此处分子为2的原因是假设正负类标记为+1与-1）
$\gamma = \frac { 2 } { | | w | | }$

在这里插入图片描述

我们的目标是使得间隔最大化，即意味着要取得 $∣∣ w ∣∣$ 最小化，也就是 $w | | ^ { 2 }$ 最小化
所以我们最终可以的到SVM基本型：
在这里插入图片描述

求解方法：

涉及到二次规划问题，使用拉格朗日乘子法解决问题，我们会得到基本型的“对偶问题”

具体方法不做详解，此处仅做大概阐述：

在SVM基本型的每条约束上增加一个拉格朗日乘子a，得到新的函数
新函数对w和b分别求偏导=0，得到w和b关于a的表达式
将表达式回代入函数，就得到了仅依赖于a的函数，就将约束问题转化成无约束问题
此时使用梯度下降、牛顿法等无约束优化算法可得出a，回代表达式得出w和b，完成原本函数的求解

核函数

引入原因：

由于前面的讨论都是基于训练集是线性可分的假设
而对于非线性可分的数据集，我们就可以采用核方法将数据集变成线性可分的

升维思想：

找到一个函数(即核函数)将非线性可分的数据映射为线性可分的数据

常用核函数：

下面给出常用核函数：

在这里插入图片描述

软间隔和正则化：

引入原因：

前面进行分类任务都是基于训练样本线性可分的假设，
而实际应用中，训练集存在噪声或难以找到合适的核函数将数据转化为线性可分的数据
如果找到了核函数也很有可能这个线性可分的结果是因为模型过拟合造成的。

所以我们引入了软间隔Soft Magrin这个概念，即允许部分样本划分出错。
而相应的，先前我们让所有样本正确分类就叫做硬间隔。

正则化思想：

其实软间隔也就是一种正则化，通过对不希望的到的结果进行惩罚，使得优化过程趋向于希望目标。

支持向量回归

引入原因：

我们一开始引入SVM就是为了解决分类问题，而对于回归问题是否也能通过SVM解决呢？🤔

为了解决回归问题，我们引入了支持向量回归，简称SVR(Support Vector Regression)

方法思想：

在损失函数方面，与传统的回归模型用预测和标记的差别计算损失不同，

SVR容忍预测和标记之间存在偏差e，在偏差2e内都被判定为正确预测

关注

26
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】支持向量机（SVM）

机器学习-西瓜书-🍉Book-6章-支持向量机
复制链接

扫一扫

专栏目录

HP-Patience CSDN认证博客专家 CSDN认证企业博客

码龄1年

18: 原创

2万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

490: 积分

226: 粉丝

279: 获赞

4: 评论

262: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文阅读-Baseline与Benchmark介绍
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
统计学-时间序列(Part 1)-时间序列概述
CSDN-Ada助手: 恭喜您在统计学领域写下了第7篇博客，标题为“时间序列概述”，内容一定十分精彩。希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。下一步可以考虑深入探讨时间序列分析的具体方法和应用场景，让读者更加深入地了解这一领域。期待您的更多精彩文章，加油！
【机器学习】模型评估与选择(Part 1)
CSDN-Ada助手: 恭喜你写完了第5篇博客！看到你对西瓜书第2章的模型评估与选择有深入的了解，让我感到十分欣慰。接下来，我建议你可以继续深入学习和探索，比如可以尝试结合实际案例来分析模型评估的实际应用，或者挑选一些经典的算法进行比较和评估。希望你能继续保持热情，不断进步，期待你更多精彩的创作！
ACM算法竞赛---学习路线---中级
CSDN-Ada助手: 非常感谢您分享这篇关于ACM算法竞赛学习路线的中级内容！您的博文内容涵盖了许多算法和技术，让读者可以系统地学习和提高自己的算法竞赛能力。除了您提到的内容，我还想分享一些扩展知识，比如动态规划、网络流算法、字符串算法等，它们在ACM算法竞赛中也非常重要。希望您可以继续写下去，分享更多精彩的内容，让更多人受益！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
ACM算法竞赛---学习路线---初级
CSDN-Ada助手: 恭喜你开始博客创作！标题中的“ACM算法竞赛---学习路线”听起来非常有趣和有价值。作为一个新的博主，你选择了一个受欢迎且有挑战性的主题。我期待着读到你的博客，了解你的学习路线和经验分享。在你的下一步创作中，我建议你可以根据自己的学习经验，分享一些实用的学习方法和技巧。这将有助于那些刚开始学习ACM算法竞赛的读者更好地入门和提高。同时，你也可以在博客中引用一些经典的ACM竞赛题目，讲解解题思路和技巧，给读者提供更多的实战经验。祝愿你的博客越来越好，期待你的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。