常见的平面概念是在三维空间中定义的:Ax+By+Cz+D=0Ax+By+Cz+D=0,
而d维空间中的超平面由下面的方程确定:wTx+b=0,其中,w与x都是d维列向量,x=(x1,x2,…,xd)为平面上的点,w(w1,w,…,wd)为平面的法向量。b是一个实数, 代表平面与原点之间的距离。
实际上,支持向量机的最大边界超平面的方程w*x+b=0是假定出来的。其中,w为法向量,决定了超平面方向,b是位移量,可以决定超平面与原点之间的距离。显然,法向量w和位移b可以在空间(或者平面)内确定唯一的超平面。
我们知道,对于支持向量机最关键的问题就是选择位于距离测试集两类样本的边界观测点最远的划分作为支持向量分类的超平面,我们称之为最大边界超平面。这个超平面距离两类不同样本的边界点的距离是相同的,所以我们为简化问题,将这个超平面的方程设定为w*x+b=0
其中w和x各自表示的是一个向量,并不是一个数。如果只是针对二维的情况:
所以,二维的分离超平面是
对应的就是书中图里的直线。
如果维度更高,同理。
为什么w是法向量呢?在感知机模型中为什么权重向量与神经网络中的决策平面正交?
答案:
https:// stackoverflow.com/quest ions/10177330/why-is-weight-vector-orthogonal-to-decision-plane-in-neural-networks
或者
如果一个超平方的方程是aTx+b=0,那么法向量v就必须垂直于这个超平面内的任意一个向量。
假设x1,x2是超平面上的任意两点,那么它们满足aTx1+b=0, aTx2+b=0
x1和x2构成的向量是x1−x2。根据上面的式子,我们也知道aT(x1−x2)。
所以a向量就是始终和超平面内任意一个向量垂直的向量,所以法向量v就等于a。 http:// sofasofa.io/forum_main_ post.php?postid=1003646
支持向量机分类超平面方程为什么是w*x+b=0? - 南华寺知秋的回答 - 知乎 https://www.zhihu.com/question/263816665/answer/332269356
支持向量机分类超平面方程为什么是w*x+b=0? - 小毕的回答 - 知乎 https://www.zhihu.com/question/263816665/answer/298109669