Datawhale组队学习—吃瓜教程task05

最新推荐文章于 2024-08-09 20:06:11 发布

伟伟好帅

最新推荐文章于 2024-08-09 20:06:11 发布

阅读量111

点赞数

文章标签：支持向量机 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73839894/article/details/129287477

版权

支持向量

简单来说，什么是支持向量呢？从几何角度，对于线性可分数据集，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，且不偏不倚，泛化性能更好。我们task04中讲到感知机，能将正负空间分开的都是感知机的最优解，但是支持向量再处理这个问题上就只有一个最优解。

先介绍一下几何间隔的概念：

在西瓜书中，关于支持向量的基本型如下：

这里我们结合南瓜书，从机器学习三要素:模型、策略、算法，经行分析。

模型：给定线性可分数据集，支持向量机模型希望求得数据集关于超平面的几何间隔达到最大的那个超平面，然后套上一个函数实现分类功能。

策略：给定线性可分数据集，设中几何间隔最小的样本为，那么支持向量机找超平面的过程可以转化为以下带约束条件的优化问题。

那对于这个问题应该如何求解呢？此优化问题为含不等式约束的优化问题，且为凸优化问题，因此可以直接用很多专门求解凸优化问题的方法求解该问题，在这里，支持向量机通常采用拉格朗日对偶来求解。

下面介绍拉格朗日函数

之后对相关问题的求解就一目了然了。

而西瓜书中介绍的是SMO法：

这时候大家可能有疑问，为什么支持向量机通常都采用拉格朗日对偶求解呢？

1. 无论主问题是何种优化问题，对偶问题恒为凸优化问题，因此更容易求解（尽管支持向量机的主问题本就是凸优化问题），而且原始问题的时间复杂度和特征维数呈正比（因为未知量是），而对偶问题和数据量成正比（因为未知量是），当特征维数远高于数据量的时候拉格朗日对偶更高效；

2. 对偶问题能很自然地引入核函数，进而推广到非线性分类问题（最主要的原因）。

核函数:这一块南瓜书上介绍的已经很详细了，我们直接引用。

软间隔：从数学角度来说，软间隔就是允许部分样本（但要尽可能少）不满足下式中的约束条件。

这就是常用的软间隔支持向量机。

支持向量回归：

注：这一块涉及到多个公式推导，本博客仅作记录和逻辑连接（个人水平有限），供二刷使用，如有不合理，请大家多多包涵。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Datawhale组队学习—吃瓜教程task05

简单来说，什么是支持向量呢？从几何角度，对于线性可分数据集，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，且不偏不倚，泛化性能更好。我们task04中讲到感知机，能将正负空间分开的都是感知机的最优解，但是支持向量再处理这个问题上就只有一个最优解。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。