SVM中为何间隔边界的值为正负1

在WB二面中,问到让讲一下SVM算法。

我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性分割面的两个面作为间隔边界,分别为:wx+b=1和wx+ b = -1。

面试官就问,为什么是正负1?

当时没有答上来,看来还是对模型不够理解。

回来查资料和ppt等,解答如下:

线性分割面是f(x) = wx + b,该线性分割面是要把样本点分为两类:

对于正样本,都满足:wx + b > 0;

对于负样本,都满足:wx + b < 0;

从式子中可以观察到,如果同时放大或缩小w和b,最后的结果是不受影响的,还是同一个线性分割面。因此,我们可以做一个要求:

对于所有正样本,都满足:wx + b >= 1;

对于所有负样本,都满足:wx + b <= -1;

其中,间隔边界外的点对应的是">"或"<"号,而间隔边界上的点,对应的是"="号。

即得到:

对于间隔边界上的正样本,都满足:wx + b = 1;

对于间隔边界上的负样本,都满足:wx + b = -1;

这就是间隔边界上的值为正负1的由来。


PS1:

硬间隔SVM中,最小化间隔为:

min f(w) = w.T * w / 2

其约束条件为:使所有的样本点都能正确划分,即:

s.t.   y_i(w * x_i + b) >= 1。

注意:不等式是包含等号"="的,是说,所有的点都在间隔边界之上或之外,不允许出现在间隔边界与分类超平面之间的!


PS2:

对于软间隔SVM中的松弛变量的概念。噪声点并非只能存在于正确间隔边界外,由于有了松弛变量把它拉回来,因此,噪声点是可以到两个间隔边界之中,或者到错误的间隔边界之外的(当然,如果只是出现在分类超平面和正确的间隔边界之间,此时该点还是会被正确分类的,但是,此时它还是会为l(w)函数贡献松弛变量e的。)。此时的限制条件为:

s.t. y_i(w * x_i + b) + e_i >= 1,其中,e_i >= 0。


  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值