SVM函数间隔和几何间隔

刚开始接触SVM,遇到函数间隔和几何间隔,对这2个概念有点混肴,查阅一些资料后有点明白了。

函数间隔:

并不是实际意义上的点到超平面的距离,只是表示点到超平面的远近。

比如平面方程1:3x1 + 6x2 - 12 = 0 和平面方程2:x1 + 2x2 - 4 = 0 都过点(4,0)和(2,0),虽然平面方程1的系数是平面方程2的3倍,但它们是同一条线同一个平面。函数间隔等于y(wx + b),因为y等于1或者-1,所以函数间隔的大小由(wx + b)来决定。

假如有一个点A(5,0)(该点是正分类点,也就是y=1),刚开始我们把平面方程1当作超平面S,A点到超平面S也就是平面方程1的函数间隔是1(3*5+6*0-12)=3,然后我们再把超平面S的系数都乘以1/3,此时超平面S就是平面方程2,因为平面方程1和平面方程2是同一个平面,所以超平面S相对于A点的位置没有发生变化,但是此时A点到超平面S也就是平面方程2的函数间隔变成了1(5+2*0-4)=1。

从这个例子我们可以看出,等比例缩小或放大超平面的系数,超平面相对于某点的位置没有发生变化,但是某点到超平面的函数间隔却等比例缩小或放大了,因此我们知道了函数间隔不能准确的表示点到超平面的距离。

 

几何间隔:

几何间隔表示的是点到超平面的距离。

上面图片里是我百度的点到直线的距离公式。其中,A和B的平方和的二次方跟就是上面函数间隔里的w的2-范数,绝对值里面的一堆其实就是函数间隔计算出来的值。也就是几何间隔等于函数间隔除以系数的2-范数。

还拿解释函数间隔的例子来说,有一正分类点A(5,0),我们把平面方程1:3x1 + 6x2 - 12 = 0 当作超平面S,A点到超平面S也就是平面方程1的距离也就是几何间隔等于1(3*5+6*0-12)/sqrt(square(3)+square(6))=1/sqrt(5)(square表示平方,sqrt表示平方根)。

 

从上面的介绍我们可以得出:几何间隔是点到超平面的距离,函数间隔只能相对的表示点到超平面的远近,不准确有局限性。

 

 

更专业的说明可以参考以下资料:
https://www.zhihu.com/question/64568136

https://baike.baidu.com/item/%E7%82%B9%E5%88%B0%E7%9B%B4%E7%BA%BF%E8%B7%9D%E7%A6%BB/8673346

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值