SVM松弛变量图解

当样本集处于非线性可分时,需要引入松弛变量\xi,放松线性约束。

 

松弛变量是什么?

松弛变量\xi _{i} :指出第i个观测的位置、相对于间隔的位置、以及相对于超平面的位置。

\xi _{i}=0,表示第i个样本落在间隔正确的一面;\xi _{i}>0,说明落在错误的一面。

例如,对于图中右下角那个红圈,\xi _{5}>0

 

引入松弛变量是如何处理线性不可分的?

 

先看优化目标(未引入松弛变量):

\underset{w,b}{min} \frac{1}{2} \parallel w\parallel ^2

s.t  y_{i} (w^Tx_{i}+b)\ge 1, i=1,2,...m

 

引入松弛变量后的优化目标:

\underset{w,b}{min} \frac{1}{2} \parallel w\parallel ^2 +C\left \{ \sum_{i}^{m} \xi ^{(i)} \right \}  

s.t  y_{i} (w^Tx_{i}+b)\ge 1-\xi ^{(i)}, i=1,2,...m

 

可以把松弛变量理解为:异常点离群距离的大小。例如,如果把右图红圈5当做异常值,那么离群值就大于0,也就是说,\xi _{5}>0,那么\sum_{i}^{m} \xi ^{(i)}>0

 

变量C用来控制对错误分类的惩罚,C越大,对错误的惩罚越大。换句话说,C越大,对错误分类的要求就越严。(如图所示)

如果考虑极端情况,C取无穷大,那么C\left \{ \sum_{i}^{m} \xi ^{(i)} \right \} \rightarrow \infty,问题就无解了。

如果C较小,那么C\left \{ \sum_{i}^{m} \xi ^{(i)} \right \}中,\sum_{i}^{m} \xi ^{(i)}增加时(有更多异常点的加入),对C\left \{ \sum_{i}^{m} \xi ^{(i)} \right \}的影响就比较小了,那么就能忽略更多的“异常点”,降低模型的方差。

 

以上就是我对软间隔分类中松弛变量的理解,由于昨天刚学习SVM,如果哪里理解有误,还望指正!

 

 

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值