envi支持向量机分类未响应_SVM | 支持向量机原理讲解(二)

本文详细介绍了线性可分支持向量机存在的问题,特别是面对线性不可分或存在异常点的数据集时。通过引入软间隔最大化,允许支持向量机在一定的误差范围内进行分类,提高模型的泛化能力。软间隔最大化的线性支持向量机通过调整约束条件和目标函数,利用拉格朗日乘子法进行优化,最后得出支持向量的分类决策函数。文章还讨论了KKT条件、支持向量的定义以及合页损失函数,为后续非线性支持向量机的学习奠定了基础。
摘要由CSDN通过智能技术生成

329c75442da8dd43a085847e1579c193.png

译者 | Ray

编辑 | 安可

一、线性可分的支持向量机存在的问题

在支持向量机一中,我们介绍了当数据集是线性可分的时候,我们可以使用线性可分的支持向量机将数据进行分类(由于隔了很长时间才更新,因此忘记了支持向量机一的读者可以回看支持向量机一讲解)。但是,在现实生活中,还存在着很多数据是线性不可分的,或者说本来是线性可分的数据因为存在一些异常点,使得不能线性划分。

第一种情况如果数据是不能线性可分的话,线性可分的支持向量机是不适用。而第二种情况下,我们通过下图发现,如果在没有A点的情况,我们学到的超平面是黑线所示,但是由于A点的存在,模型会尽可能的拟合所有训练样本点,使得学习到的超平面就是红线所示。但我们可以很清楚的发现黑线是一个更好的超平面,能够将两类样本点分的更开,从而有更好的泛化能力。因此当有异常点的存在时会很大程度影响模型的泛化能力。

e178e822eabfd379cda96948fafeafa4.png

二、软间隔最大化的线性支持向量机问题定义

在线性可分的支持向量机中,是需要保证支持向量到超平面的函数间隔大于等于1的(如果忘记了可以回去查看支持向量机一讲解)。为了解决这类数据问题,使得支持向量机有更强的泛化能力,引入了软间隔最大化的支持向量机。所谓的软间隔就是说为每个样本点引入了一个松弛变量ε,这样支持向量到超平面的函数间隔不需要严格保证大于等于1,可以有ε的弹性范围。即约束条件就变成:

78109f87bb6e33d6f7b0aa6ba241d56c.png

当然这个弹性范围不是随便给的,如果样本需要这个弹性范围,那就必须支付一定的代价,因此目标函数会加上每个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值