【机器学习西瓜书学习笔记——支持向量机】

最新推荐文章于 2024-08-03 00:03:53 发布

未来、梦想

最新推荐文章于 2024-08-03 00:03:53 发布

阅读量451

点赞数 8

文章标签：机器学习学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51148715/article/details/140870013

版权

第六章支持向量机

6.1 间隔与支持向量

**支持向量：**最靠近两条虚边界的向量叫做支持向量。

**间隔：**两个异类支持向量到超平面的距离之和称为间隔。

硬间隔最大化

支持向量机求的最优分离超平面，不仅要分类正确，而且要使得间隔最大化。

6.2 对偶问题

在这里插入图片描述

6.3核函数

非线性数据(非线性问题——>线性问题)

原理是将数据映射到高维数据，在高维空间线性可分。

从低维转换到高维，$\Phi $是转换函数。

定义

将原始空间中的向量作为输入向量，并返回特征空间（转换后的数据空间,可能是高维）中向量的点积的函数称为核函数。

构建核函数

线性核函数

高斯核函数

应用

K近邻、支持向量机

优劣

优势

核函数在某些特征空间通过点积的方式计算，但无需知道特征空间以及转换函数。这就是核函数的有用之处。
使在高维空间中以极低的计算成本寻找线性关系成为可能，这是因为在特征空间中输入图像的内积可以在原始空间中计算出来
不需要数据是真实的向量，可用于字符串、时序数据

劣势

为给定的问题选择核函数可能很困难
对于大型数据集，可能无法存储整个核函数矩阵，可能需要重新计算核函数

6.4 软间隔与正则化

软间隔

目的：提高模型对噪声和异常值的鲁棒性，从而获得更好的泛化能力。

正则化

防止出现过拟合现象

6.5支持向量回归（SVR）

SVM是要使到超平面最近的样本点的“距离”最大

SVR是要使到超平面最远的样本点的“距离”最小
在这里插入图片描述

函数间隔和几何间隔

两虚线之间的几何间隔$r=\frac{d}{\left | W \right | } $,这里的d就为两虚线之间的函数间隔。

SVR的原理

SVR在线性函数两侧制造了一个“间隔带”，间距为ϵ(也叫容忍偏差，是一个由人工设定的经验值)，对所有落入到间隔带内的样本不计算损失，也就是只有支持向量才会对其函数模型产生影响，最后通过最小化总损失和最大化间隔来得出优化后的模型。

如图所示，"管道"内样本对应 $a = 0$ ，为非支持向量；
位于“管壁”上的为边界支持向量， $0 < a < ϵ$
位于"管道"之外的为非边界支持向量， $a > ϵ$ (异常检测时，常从非边界支持向量中挑选异常点)

SVR数学模型

在这里插入图片描述

线性硬间隔SVR

不允许样本分类错误。

线性软间隔SVR

允许一定量的样本分类错误。
原因：在现实任务中，往往很难直接确定合适的 $\epsilon$ ，确保大部分数据都能在间隔带内，而SVR希望所有训练数据都在间隔带内，所以加入松弛变量 $\xi$ ，从而使函数的间隔要求变的放松，也就是允许一些样本可以不在间隔带内。

未来、梦想

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
【机器学习西瓜书学习笔记——支持向量机】

将原始空间中的向量作为输入向量，并返回特征空间（转换后的数据空间,可能是高维）中向量的点积的函数称为核函数。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。