超平面
常见的平面概念是在三维空间中定义的:
Ax+By+Cz+D=0
,
而d维空间中的超平面由下面的方程确定:
wTx+b=0
,其中,w与x都是d维列向量,
x=(x1,x2,…,xd)T
为平面上的点,
w=(w1,w2,…,wd)T
为平面的法向量。b是一个实数, 代表平面与原点之间的距离.
点到超平面的距离:
假设点x′为超平面
A
:
超平面的正面与反面:
一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面。
法向量的意义
在空间里,向量可以看做是一个点(以原点为起始点的向量),对于分离超平面方程里的向量 x ,就可以看做由坐标原点到超平面任意“点”的向量
法向量的大小是坐标原点到分离超平面的距离,垂直于分离超平面,方向有分离超平面决定。
支持向量机的一些理解
首先如果超平面的形式为:
学习过程中会有几个疑惑的地方:
- 统一超平面的形式:即在 w,b 同时扩大或缩小相同倍数后得到不同的超平面形式,但其实代表同一超平面。此时可以通过找到离这条直线最近的点 x′ ,方程两边同时除以 |wTx+b| ,注意离超平面最近的点使得 |wTx+b|=1 ,其他的点都是 |wTx+b|⩾1 ,再利用样本的标签 +1,−1 使得到的超平面方程统一化。此时数据集到求出的超平面的最短距离是 1||w||
- 按照同样的方式的到了其他的超平面,此时数据集到求出的超平面的最短距离也是 1||w|| ,但确是不同的 w <script type="math/tex" id="MathJax-Element-22">w</script>,此时应选数据集到这些超平面中最小距离中最大的那一个作为最好的分割超平面,运用运筹学分支之一的非线性规划的知识可解得此约束最优化问题。
参考:http://blog.csdn.net/zhangping1987/article/details/21931663