SVM 之 松弛变量

SVM在面对线性不可分数据时引入松弛变量,允许部分样本点不满足约束,通过惩罚因子C平衡离群点的影响。松弛变量表示点偏离分类平面的程度,C决定对离群点的容忍度。高C值使问题接近硬间隔,低C值则更宽容。
摘要由CSDN通过智能技术生成

接下来说说SVM怎么对线性不可分的数据进行处理

 

 

5.   SVM松弛变量

 

有的时候,数据并不是严格线性可分的,可能有几个数据到了对方类别的区域,导致原本线性可分的问题变成了线性不可分的。这样类似的问题(仅有少数点线性不可分)叫做近似线性可分的问题。

 

以我们人类的常识来判断,说有一万个点都符合某种规律(因而线性可分),有一个点不符合,那这一个点是否就代表了分类规则中我们没有考虑到的方面呢(因而规则应该为它而做出修改)?

 

其实我们会觉得,更有可能的是,这个样本点压根就是错误,是噪声,是提供训练集的同学人工分类时打瞌睡错放进去的。所以我们会简单的忽略这个样本点,仍然使用原来的分类器,其效果丝毫不受影响。

 

但这种对噪声的容错性是人的思维带来的,我们的程序可没有。由于我们原本的优化问题的表达式中,确实要考虑所有的样本点(不能忽略某一个,因为程序它怎么知道该忽略哪一个呢),在此基础上寻找正负类之间的最大几何间隔,而几何间隔本身代表的是距离,是非负的,像上面这种有噪声的情况会使得整个问题无解。这种解法其实也叫做硬间隔

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值