预备
适合场景
如果训练输入线性不可分,存在一些特异点,通过软间隔最大化学习得到的线性分类器称为线性支持向量机。
构建目标函数
和线性可分支持向量机不同在于有些实例点不满足函数间隔大于等于1的条件。考虑引入松弛变量
ξi≥0
和惩罚参数
C
:
s.t.yi(w⋅xi+b)≥1−ξi,i=1,2,...,N
ξi≥0,i=1,2,...,N
目标函数有两部分组成:第一部分是间隔,第二部分是误分类点的个数。C是惩罚参数,用于调和两部分的关系。
求解的对偶算法
原始问题的对偶问题是:
minα12∑i=1N∑j=1Nαiαjyiyj(xi⋅xj)−∑i=1Nαi
∑i=1Nαiyi=0
0≤αi≤C,i=1,2,...,N
假设 α∗=(α∗1,α∗2,...,α∗N)T 是上面问题的最优解,那么:
w∗=∑i=1Nα∗iyixi
选择一个下标j,使得 0<α∗j<C ,可得:
b∗=yj−∑i=1Nα∗iyi(xi⋅xj)
根据KKT互补条件可知, α∗i>0 对应的实例为支持向量。
此时的支持向量可能分布在边界线或者边界线和分离超平面之间或者分离超平面误分一侧。