根据李航老师书,自己理清一下对于函数间隔和几何间隔部分的理解。
超平面:
超平面关于样本点的函数间隔为:
当超平面为:
时,超平面还是原来那个超平面,但函数间隔已经变为
所以当同比例缩放w和b时,h可以趋向无穷大,这也就没有求函数间隔最大化的意义了。
而几何间隔就是超平面到点的物理距离,公式也等于函数间隔除以w的范数,即
,当同比例缩放w和b时,几何间隔的值是确定的,所以我们发现几何间隔能够更好的分类。用它来做间隔最大化.
PS:什么时候用函数间隔,什么时候用几何间隔?
感知机最后形式是函数间隔,因为感知机是误分类系统,感知机的目标是使误分类的点的个数为0,加不加||w||的范数对于损失函数的的正负判定毫无影响,而且加了后会增加计算的复杂度。
而间隔最大化思想找到最优超平面,几何间隔相对于函数间隔的一个区别就是它不受参数( 和
)缩放影响。所以这两个的作用场景是不同的,需要我们具体情况具体分析。