对于给定的训练数据集T和超平面(w,b),定义超平面关于样本点(x_i,y_i)的函数间隔为
定义超平面(w,b)关于训练数据集T的函数间隔为超平面关于T中所有样本点的函数间隔之最小值,即
函数间隔可以表示分类预测的正确性及确信度,但选择分离超平面时,只有函数间隔还不够,因为只要成比例改变w和b,超平面并没有改变,但函数间隔却变了,因此需要对分离超平面的法向量加上某些约束,如规范化,||w||=1,使用间隔是确定的,这时函数间隔成为了几何间隔。
几何间隔
对于给定的训练数据集T和超平面(w,b),定义超平面关于样本点(x_i,y_i)的几何间隔为
其中,||w||为w的L_2范数。定义超平面(w,b)关于训练数据集T的几何间隔为超平面关于中所有样本点的几何间隔之最小值,即
由函数间隔和几何间隔的定义可知,它们之前的关系如下: