机器学习（6） -- 支持向量机

最新推荐文章于 2021-12-24 11:46:28 发布

じんじん

最新推荐文章于 2021-12-24 11:46:28 发布

阅读量372

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43575791/article/details/105451819

版权

机器学习专栏收录该内容

21 篇文章 1 订阅

订阅专栏

6.1 间隔与支持向量

优化

即

6.2 对偶问题

对上式使用拉格朗日乘子法可得其对偶问题

分别对我w,b求偏导

代入L（w,b,α），消去w,b，即得

----------1式

求解α，代入模型

上述过程满足KKT条件：

这个是拉格朗日乘子

约束条件

这个是拉格朗日乘子

求解1式，SMO算法

SMO算法基本思路是先固定之外的所有参数，然后求上的极值。由于存在约束，于是每次选择两个变量和，并固定其他参数，参数初始化后，SMO不断执行如下两步：

选取一对需要更新的变量和；

固定和以外的参数，求解1式获得更新后的和

直观看，KKT条件违背的程度越大，则变量更新后可能导致的目标函数值减幅越大。于是，SMO先选取违背KKT 条件程度最大的变量。

SMO采用了启发式:使选取的两变量所对应样本之间的间隔最大。直观解释是这样的两个变量有很大差别，与对两个相似的变量进行更新相比，对他们进行更新会带给目标函数值更大的变化

6.3 核函数

原始样本空间不存在能正确划分两类样本的超平面，如异或问题。

于是将原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性可分。

如果原始空间是有限维，即属性数有限，那么一定存在一个高维特征空间使样本可分。

于是，划分超平面对应的模型为

优化目标

对偶问题

核函数：

替换，求解：

只要一个对称函数所对应的核矩阵半正定，它就能作为核函数使用。对于一个半正定核矩阵，总能找到一个与之对应的映射φ。也就是，任何一个核函数都隐式地定义了一个称为“ 再生核希尔伯特空间”的特征空间。

若K1，K2是核函数，则γ1K1+γ2K2，，K(x,z)=g(x)K1(x,z)g(z) 也是核函数

6.4 软间隔与正则化

允许支持向量机在样本上出错

于是，优化目标写为：

C无穷大时迫使所有样本满足约束，当C取有限值时，允许一些样本不满足约束

数学性质不好，于是用其他函数替代，称为替代损失

hinge损失

引入松弛变量

拉格朗日乘子法

通过采用hinge损失扔保持了稀疏性

使用对率损失几乎得到了对率回归模型，两者优化目标相近，性能也相当。

对率回归输出概率，支持向量机不具备概率意义

对率回归能直接应用于多分类任务，支持向量机需要推广

是光滑递减函数，不能导出类似支持向量的概念，因此对率回归的解依赖更多样本，预测开销大

优化目标一般形式：

---------2式

Ω（f）：结构风险，描述模型f的某些性质

：经验风险，描述模型与训练数据的契合程度

C：对二者折中

从经验风险最小化角度看，Ω（f）表述了我们希望获得具有何种性质的模型（例如希望获得复杂度较小的模型），另一方面，该信息有助于削减假设空间，从而降低了最小化训练误差的过拟合风险，从这个角度说，2式称为“正则化问题”，Ω（f）为正则化项，C为正则化常数。

正则化可理解为一种“罚函数法”，即对不希望得到的结果施以惩罚，从而使得优化过程趋向于希望目标。从贝叶斯估计角度来看，正则化项可以认为是提供了模型的先验概率。

6.5 支持向量回归SVR

传统回归基于模型f(x)与真实输出y之间的差别来计算损失，当且仅当f(x)与y完全相同时损失才为0。

支持向量回归假设我们能容忍f(x)与y之间最多有ε的偏差，即仅当f(x)与Y之间的差别绝对值大于ε时才计算损失，这相当于以ε为中心，构建了一个宽度为2ε的间隔带，若样本落入此带，则认为是被预测正确的

于是

引入松弛变量

拉格朗日函数

对偶问题

解形如

仅当（xi,yi）不落入ε间隔带中，相应的才能取非零值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（6） -- 支持向量机

6.1 间隔与支持向量优化即6.2 对偶问题对上式使用拉格朗日乘子法可得其对偶问题分别对我w,b求偏导代入L（w,b,α），消去w,b，即得----------1式求解α，代入模型上述过程满足KKT条件：这个是拉格朗日乘子约束条件这个是拉格朗日乘子求解1式，SMO算法SMO算法基本思路是先固定之外的所有参...
复制链接

扫一扫

专栏目录

じんじん CSDN认证博客专家 CSDN认证企业博客

码龄6年

170: 原创

23万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

2502: 积分

499: 粉丝

702: 获赞

24: 评论

761: 收藏

私信

关注

热门文章

分类专栏

论文 68篇
杂七杂八 7篇
数学 12篇
data structures 5篇
机器学习 21篇
计算机编程 17篇
强化学习 3篇
计算机视觉 1篇
NLP 14篇
3D 8篇
深度学习 9篇
射影几何 5篇

最新评论

矩阵分析及应用（1-2章）
jack_tony70: 請問這是哪本書呢？還是書名就叫做「矩陣分析及應用」？
论文阅读——Unified Generative Adversarial Networks for Controllable Image-to-Image Translation
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
论文阅读——Unified Generative Adversarial Networks for Controllable Image-to-Image Translation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读——MVDiffusion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读——Sat2Vid
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。