支持向量机原理（二）线性支持向量机的软间隔最大化模型

最新推荐文章于 2024-03-13 18:48:31 发布

yhgao96

最新推荐文章于 2024-03-13 18:48:31 发布

阅读量580

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37570854/article/details/90759389

版权

上一节当中我们对线性可分，即硬间隔情况进行了介绍，本节继续介绍一下支持向量的软间隔模型。

1.线性分类SVM面临的问题

我们在讨论线性支持向量机的时候，就假定数据是线性可分的，也就是说可以找到一个可行的超平面可以将数据完全分开，但是有的时候会在可分类的样本中混入异常点，我们称之为outlier,存在这种outlier导致样本不能线性可分，比如下面的这张图，本来所有的样本都是可以线性分类的，但是由于一个橙色和一个蓝色的异常点导致了我们没法按照之前的线性支持向量机中的方法来进行分类。

图1：混入异常点的样本

或者还有这样一种情况，如下图所示，其中的异常点并没有那么严重的不可分，但是会严重影响预测效果，如果我们不考虑左上角的蓝色异常点，那么超平面会是图中的红线，但是由于存在这样的一个异常点，导致了我们的超平面是下图中的粗虚线，这样会严重影响我们的分类模型预测效果。

图2：SVM中的outlier

2.线性分类SVM的软间隔最大化

这里的软间隔（soft margin）是相当于上一节的硬间隔而言的，回顾一下硬间隔最大化的条件：

$min \frac{1}{2}\left\|w\right\|^{2}$

$\begin{matrix} s.t. &y_i(w^{T}x_i+b)\geq1(i=1,2,3,...n) \end{matrix}$ (2.1)

SVM对训练集里面的每个样本 $(x_{i},y_{i})$ 引入了一个松弛变量 $\xi _i\geq0$ ，使函数间隔加上松弛变量大于等于1，即：

$y_i(w^Tx_i+b)\geq1-\xi_i$ (2.2)

松弛变量 $\xi_i$ 对应着数据点 x_i 允许偏离函数间隔的量，当然 $\xi_i$ 也不是无限大的，每一个松弛变量都对应这一个代价，所以要在原来的目标函数后面加上一项，使得这些 $\xi_i$ 的总和也要最小，即得到软间隔最大化的学习条件：

$min\frac{1}{2}\left\|w\right\|+C\sum_{i=1}^{n}\xi_i$

$\begin{matrix} s.t. &y_i(w^{T}x_i+b)\geq1-\xi_i&(i=1,2,3...n) \end{matrix}$ (2.3)

$\begin{matrix} \xi_i\geq0 & (i=1,2,3,...,n) \end{matrix}$

这里的C作为惩罚参数，C越大，对误分类的惩罚越大，C越小，对误分类的惩罚越小。也就是说，我们希望

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
支持向量机原理（二）线性支持向量机的软间隔最大化模型

上一节当中我们对线性可分，即硬间隔情况进行了介绍，本节继续介绍一下支持向量的软间隔模型。1.线性分类SVM面临的问题我们在讨论线性支持向量机的时候，就假定数据是线性可分的，也就是说可以找到一个可行的超平面可以将数据完全分开，但是有的时候会在可分类的样本中混入异常点，我们称之为outlier,存在这种outlier导致样本不能线性可分，比如下面的这张图...
复制链接

扫一扫

专栏目录

yhgao96 CSDN认证博客专家 CSDN认证企业博客

码龄7年

78: 原创

23万+: 周排名

215万+: 总排名

27万+: 访问

: 等级

2186: 积分

138: 粉丝

238: 获赞

36: 评论

1740: 收藏

私信

关注

分类专栏

linux 2篇
C语言 4篇
机器人平衡控制 1篇
数据结构 5篇
python 4篇
Tensorflow 4篇
Git 1篇
SQL 1篇
自动控制理论 2篇
图像处理 9篇
算法 6篇
C++ 33篇
机器学习 9篇
机器人动力学 9篇
概率统计 2篇
串口通讯 1篇
一些小技巧 7篇

最新评论

常用的公共数据集（一）
矢量鱼: 您好，请问你有这个数据集了吗，可以发我一份吗，非常感谢跪谢 nqn7m1ovo@gmail.com
常用的公共数据集（一）
Lu_vierzehn: 您好，请问你有这个数据集了吗，可以发我一份吗，非常感谢跪谢3032249276@qq.com
常用的公共数据集（一）
Cgxdgfcd: 你好博主，请问CRCHistoPhenotypes能发我一份吗1052295067@qq.com
常用的公共数据集（一）
m0_63281672: 你好博主，请问有UBFC-RPPG数据集了吗？可以发给我一份吗？非常感谢，邮箱：2029207928@qq.com
常用的公共数据集（一）
m0_63281672: 你好，请问你有UBFC-RPPG数据集了吗？可以发给我一份吗？非常感谢2029207928@qq.com。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。