西瓜书第六章学习笔记

最新推荐文章于 2024-08-13 10:17:37 发布

あいこ孙泽宇果果课踝棵裹

最新推荐文章于 2024-08-13 10:17:37 发布

阅读量43

点赞数

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_73839843/article/details/133526117

版权

本文介绍了支持向量机的基本概念，包括如何在线性可分数据集中找到最大间隔超平面，以及如何处理线性不可分情况下的软间隔和硬间隔。还讨论了优化问题的求解方法和支持向量回归(SVR)在回归问题中的应用。

摘要由CSDN通过智能技术生成

支持向量机

二分类学习最基本的想法就是基于训练集D在

样本空间中找到一个划分超平面。

支持向量机

从集合几何角度来看，对于线性可分数据集，

支持向量机就是找距离正负样本都最远的那个

超平面。

相比于感知机：其解唯一，且泛化性能更好模型

模型：给定线性可分数据集X，支持向量机模型希望求得数据集X关于超平面的几何间隔y达到最大的那个超平面，然后套上一个sign函数实现分类功能

y=sign(wTx+b)=-1 wTx+b<0

1 wTx+b>0

策略

我们希望找到具有“最大间隔”的划分超面。最后得到优化问题，欲找到具有“最大间隔”(maximum margin)的划分超平面，也就是要找到能满足式(6.3)中约束的参数t和b，使得？最大，既

MAX s.t. wTx+b) ≥1, i=1.2....,m.

显然，为了最大化间隔，仅需最大化ul|-1，这等价于最小化 te|/.于是，式MAX可重写为

min =w(wTz+b)≥1, i=1,2....,m.

这就是支持向量机(Support Vector Machine,简称SVM)的基本型算法，想要求解上述式子，得到最优解，以确定这个划分超平面所对应的模型

f(x)=wTx+b，

求解：

对于式子6.6的求解，这个优化问题为含不等

式约束的优化问题，且是凸优化问题。这里采用的是拉格朗日乘子法得到“对偶问题”，解“对偶问题”得出α，解出α后，求出w和b从而确定模型

对偶问题：软间隔与正则化

前面的支持向量机有个前提：数据集是线性可分的。，即存在一个超平面能将不同类的样本完全划分开。

为了缓解这个问题。想的一个办法就是允许支持向量机在一些样本上出错。因此，引入了“软间隔”的概念。

硬间隔：前面的支持向量机要求所有样本都必须满足式子6.3,

uTx；+b +1, =+1； (

wTx;+b＜-1, a=-1

即所有样本都划分正确。

软间隔：

允许某些样本不满足约束

min=yi（wTx+b)>1. i=1，2，3...

从数学角度来说，软间隔就是允许部分样本(但要尽可能少)不满足下式中的约束条件

min=yi（wTx+b)>1. i=1，2，3...m

因此，可以将必须严格执行的约束条件转化为具有一定灵活性的“损失”，合格的损失函数要求如下：

当满足约束条件时，损失为0

当不满足约束条件时，损失不为0，

当不满足约束条件时，损失与其违反约束条件的程度成正比

只有满足以上要求，才能保证在最小化(min)损失的过程中，保证不满足约束条件的样本尽可能的少。

优化目标(策略）

当然，在最大化间隔的同时，不满足约束的样本应尽可能少，于是，优化目标可

写为

其中C＞0是一个常数，0/是“0/1损失函数”

显然，当C为无穷大时，前者迫使所有样本均满足约后者，于是前者式等价于；当C取有限值时，前者允许一些样本不满足约束，引入松弛变量，上述优化问题和下述优化问题等价

这就是“软间隔支持向量机”

支持向量回归（SVR）

回归问题

SVR与传统回归模型计算损失的方式不同，相比于线性回归用一条线来拟合训练样本，支持向量回归(SVR)而是采用一个以f(z)=wTx+b为中心，宽度为2e的间隔带，来拟合训练样本。落在带子上的样本不计算损失（类比线性回归在线上的点预测误差为Q），不在带子上的则以偏离带子的距离作为损失（类比线性回归的均方误差），然后以最小化损失的方式迫使间隔带从样本最密集的地方（中心地带）穿过，进而达到拟合训练样本的目的。

あいこ孙泽宇果果课踝棵裹

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
西瓜书第六章学习笔记

SVR与传统回归模型计算损失的方式不同，相比于线性回归用一条线来拟合训练样本，支持向量回归(SVR)而是采用一个以f(z)=wTx+b为中心，宽度为2e的间隔带，来拟合训练样本。落在带子上的样本不计算损失（类比线性回归在线上的点预测误差为Q），不在带子上的则以偏离带子的距离作为损失（类比线性回归的均方误差），然后以最小化损失的方式迫使间隔带从样本最密集的地方（中心地带）穿过，进而达到拟合训练样本的目的。因此，引入了“软间隔”的概念。当然，在最大化间隔的同时，不满足约束的样本应尽可能少，于是，优化目标可。
复制链接

扫一扫

あいこ孙泽宇果果课踝棵裹 CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

175万+: 周排名

182万+: 总排名

398: 访问

: 等级

50: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

西瓜树学习第五章
CSDN-Ada助手: 恭喜您写完了第四篇博客，题目为“西瓜树学习第五章”。您的持续创作精神值得赞扬！通过您的文章，不仅了解到了有关西瓜树学习的知识，还能感受到您对学习的热情和坚持不懈的态度。接下来，我想提供一些建议给您，希望能帮助您在创作中不断进步。您可以考虑添加更多实例或案例，以更具体的方式展示西瓜树学习的应用场景和实践经验。此外，如果您能提供一些有关西瓜树学习的深入分析和个人见解，将会更加丰富和独特。再次恭喜您，并期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
西瓜书第六章学习笔记
CSDN-Ada助手: 恭喜您写了第五篇博客！阅读你的学习笔记让我感到非常兴奋，因为你对《西瓜书》第六章的理解和总结让我受益匪浅。希望你能继续保持这样的创作热情，坚持不懈地分享你的学习心得。如果可能的话，我建议你在下一篇博客中加入一些实际的案例分析或者个人观点，这样可以更好地吸引读者并丰富内容。期待你的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。