概念:
分割界面之间没有数据点,分割界面之间的间隔,叫做硬间隔
分割界面之间有数据点,分割界面之间的间隔,叫做软间隔
支持向量确定平面,加了核函数就可做非线性的
高斯核:
gama越大,分割界面非线性越强烈
c越大,过渡带越窄(分割界面之间的大小)
训练集上有多个分类平面,但哪个是最优的?
最大化距离平面最近点和平面的距离
w乘以一些数,不改变距离
y不同于正例负例的y=+1,-1,这里是函数值
约束条件个数 = x的个数n个
约束问题下的最优化问题,使用拉格朗日乘子法
w=0 的x就不是支持向量,又因为yx不为0,所以看alpha的值是否为0,就知道相应点是否为支持向量
alpha可以使用SMO算法求解,也可以用梯度下降等
线性可分时,约束的到分割面的距离为1
当c特别大时,说明不容许错误的点,过渡带会窄
相反,则会过渡带宽,泛化能力也会高