1、用|w∗x+b|表示点x到超平面0的距离远近,(w∗x+b)∗y表示分类的正确性以及确信度。
2、在二分类问题里,如果(w∗x+b)>0,则x的类别被判定为1;如果(w∗x+b)<0,x的类别判定为-1。
所以如果要分类正确,就一定要有y(w∗x+b)>0
3、样本点(xi,yi)和超平面之间的函数间隔为: yi(w∗xi+b)
要有更好的分类效果,就要让间隔最大。最简单的是通过让W,b同时放大N倍,
但是这时候超平面没有变化(你要找的是一个最优超平面使分类效果最好),没有意义。
4、为了让它有意义,引入 ||W||(这货是范数,不是绝对值) 约束W不让它变化。
所以几何间隔为
刚好等于点到超平面的距离公式
5、点到超平面的距离公式推导直接po别人的链接 ↓