什么是支撑向量机
Suppor Vector Machine ,既支持回归又支持分类。
之前我们进行分类使用的时决策边界,分布在不同边界的数据被分类成不同类别。如果决策边界不唯一的情况叫做不适定问题,
逻辑回归解决不适定问题,定义概率函数sigmoid。 根据sigmoid 建模形成损失函数,最小化损失函数形成边界,损失函数完全由训练集决定的。
以上左图的决策边界离红色点太近,泛化能力不太好,我们能不能把这个决策边界离红和蓝都远,这样泛化能力会更好。找到决策边界不仅很好对训练数据数据划分,还考虑到未来加入新数据的时候有很好的泛化能力。
如何找到这样一个边界? 用两跟平行直线,定义他们之间不在有 数据,这样在 定义一条到两根直线距离相等的平行线。这条线就是我们需要找到的决策边界,SVM就是尝试找到最优的决策边界,距离两个类别的样本最远,其中两边平行线上的点就叫做支撑向量。
下·
解决线性可分的问题用 Hard Mar