间隔与支持向量
首先回忆一下上节课中学习的感知机模型
从几何角度,对于线性可分数据集,感知机模型是寻找能够划分的超平面即可,因此它存在多个最优解
但是支持向量机要求找到距离正负样本都最远的超平面,与感知机相比,解是唯一的,不偏不倚,鲁棒性最好,泛化性能更好。
解释一下为什么支持向量机的泛化性能更好,
比如,我们新来一个样本,如果它更加靠近正样本,在支持向量机的解中,我们可以将其划分到正样本中(因为其超平面距离正负样本的距离都是最远的),但如果是感知机模型,有可能会被划分到负样本中
补充知识
超平面
-
为什么超平面方程不唯一???
因为我们的法向量w和位移项b可以缩放啊,同时放大或者缩小\lambda (正数)倍,对应的超平面还是一样的。
-
法向量指向的空间为正空间(在正空间中的点代入超平面方程是>0的),下面为负空间
如何确定这个中立的超平面呢?
我们找到在正例中