刚开始接触SVM,遇到函数间隔和几何间隔,对这2个概念有点混肴,查阅一些资料后有点明白了。
函数间隔:
并不是实际意义上的点到超平面的距离,只是表示点到超平面的远近。
比如平面方程1:3x1 + 6x2 - 12 = 0 和平面方程2:x1 + 2x2 - 4 = 0 都过点(4,0)和(2,0),虽然平面方程1的系数是平面方程2的3倍,但它们是同一条线同一个平面。函数间隔等于y(wx + b),因为y等于1或者-1,所以函数间隔的大小由(wx + b)来决定。
假如有一个点A(5,0)(该点是正分类点,也就是y=1),刚开始我们把平面方程1当作超平面S,A点到超平面S也就是平面方程1的函数间隔是1(3*5+6*0-12)=3,然后我们再把超平面S的系数都乘以1/3,此时超平面S就是平面方程2,因为平面方程1和平面方程2是同一个平面,所以超平面S相对于A点的位置没有发生变化,但是此时A点到超平面S也就是平面方程2的函数间隔变成了1(5+2*0-4)=1。
从这个例子我们可以看出,等比例缩小或放大超平面的系数,超平面相对于某点的位置没有发生变化,但是某点到超平面的函数间隔却等比例缩小或放大了,因此我们知道了函数间隔不