SVM 人话理解
原理:找一个超平面,把数据分开,但是这样的超平面不唯一,我们要找一个最优的。什么样的最优?样本点距离平面的最小距离最大的最优。这个距离是函数间隔。函数间隔有个问题,可以同比例缩放,所以要把函数间隔变成几何间隔,几何间隔=函数间隔除以范数。设定函数间隔=1,所以最优问题变成了范数分之一的最大化。因为范数分之一的求导不好求,所以选用1/2范数的平方求最小,所以转成凸二次规划问题。
这个问题加上一个条件:(这个条件是约束条件)所有函数距离都要大于等于1,即
约束条件乘以拉格朗日算子α组成拉格朗日函数,
求
求L的最小值,
求w,b 的最小值,α的最大值,满足KKT条件,
对上面的公式求偏导,最终可得阿尔法的值。(总之一顿数学操作之后)
此时SVM可以找到最优解。