西瓜书机器学习_六章

最新推荐文章于 2024-10-04 22:36:54 发布

CNGauss

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量123

点赞数

分类专栏：西瓜书笔记文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CNGauss/article/details/128859547

版权

西瓜书笔记专栏收录该内容

5 篇文章 1 订阅

订阅专栏

支持向量机是一种机器学习算法，通过寻找最大间隔的超平面进行分类。它考虑了样本到超平面的距离，支持向量是离超平面最近的样本。通过对偶问题解决原优化问题，引入核函数处理非线性问题，软间隔允许一定程度的错误，正则化防止过拟合。在回归任务中，SVM同样适用，通过间隔带管理预测误差。

摘要由CSDN通过智能技术生成

间隔与支持向量

对于给定的训练样本集，，分类任务即是在样本空间中寻找一个划分超平面将不能类别的样本分开。满足条件的划分超平面可能非常多，其中存在一个对训练样本局部扰动“容忍性”最好的，其性能最鲁棒，对未见示例泛化能力最强。

在样本空间中，划分超平面可通过如下线性方程来描述：

其中为超平面的法向量， $b$ 决定了超平面和原点之间的距离。样本空间任意点 $x$ 到超平面 $\left ( \omega ,b \right )$ 的距离可写为：

假设超平面 $\left ( \omega ,b \right )$ 可以将训练样本正确分类，则：

距离超平面最近的几个训练样本使上述不等式取等号，他们被称为支持向量，两个异类支持向量到超平面的距离之和为：

$\gamma$ 被称为间隔，间隔最大的划分超平面即所要求解的最优超平面，可以构建如下优化问题：

该问题可转化为：

以上就是支持向量机的基本型。

对偶问题

上述优化问题是一个凸二次规划，除了用现成的优化计算包求解，还可以通过求解对偶问题来求解原问题。拉格朗日函数为：

其中。令上式对 $\omega$ 和 $b$ 求偏导可得：

将上式带入拉格朗日函数可化简得到原问题的对偶问题：

解出 $\alpha$ 后，求出 $\omega$ 和 $b$ 即可得到模型：

上述问题转化过程去要满足KKT条件：

对于某一个具体的训练样本，总有或。若前者成立，则意味着该样本不会对模型 $f\left ( x \right )$ 产生任何影响；若，则后者必成立，该样本处于最大间隔边界上，是一个支持向量。即：训练完成后，大部分的训练样本都不需要保留，最终模型仅与支持向量有关。

对偶问题依然是一个二次规划问题，其问题规模正比于训练样本个数，计算开销极大，因此可以利用问题本身的特性来设计其他高效算法（如SMO）。

核函数

大量问题可能是线性不可分的，即不存在一个线性超平面将样本正确分类。

通过合适的核函数可以将样本从原始空间映射到一个合适的高维空间：

高维空间中，样本线性可分
维度增加，但核函数避免了计算量的显著增加

若原始空间是有限维，则一定存在一个高维特征空间使样本可分。

软间隔与正则化

现实任务中往往很难确定合适的核函数使得训练样本在特征空间中线性可分，即使可分也可能是由于过拟合造成的。

软间隔：允许某些样本不满足约束

引入松弛变量，新的优化问题可以写作：

$C$ 是一个权重系数，当其取无穷大时，问题就等价于硬间隔优化问题。软间隔优化问题的对偶问题为：

支持向量回归

对于回归任务，可将问题构建为：模型 $f\left ( x \right )$ 周围存在一个间隔带，当样本落入该间隔带以内时视作其不产生loss，否则产生，该间隔带的宽度记作 $\epsilon$ ，优化问题为：

其中：

对于该问题的求解，思路类似于求解支持向量机基本型。通过拉格朗日函数构建原问题的对偶问题，分类问题中所使用的核函数方法依然适用于回归问题。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。