⎧⎩⎨⎪⎪wTx+b≥1−ξ,yi=1wTx+b≤−1+ξ,yi=−1ξi≥0
{
w
T
x
+
b
≥
1
−
ξ
,
y
i
=
1
w
T
x
+
b
≤
−
1
+
ξ
,
y
i
=
−
1
ξ
i
≥
0
原问题转化为:
min12||w||2+C∑iξi
min
1
2
|
|
w
|
|
2
+
C
∑
i
ξ
i
s.t.yi(wTxi+b)≥1−ξi,ξi≥0
s
.
t
.
y
i
(
w
T
x
i
+
b
)
≥
1
−
ξ
i
,
ξ
i
≥
0
其中C
C
为惩罚因子,可以看到当C取很大时,优化目标函数会导致xii
x
i
i
很小,尽量减小甚至避免越界和错分情况出现。当C
C
很小时,会一定程度上对越界和错分情况有所容忍。
将约束写成gi≤0的形式,构造拉格朗日函数:
f(w)=12||w||2
f
(
w
)
=
1
2
|
|
w
|
|
2
gi(w)=1−ξi−yi(wTxi+b),hi(ξ)=−ξi
g
i
(
w
)
=
1
−
ξ
i
−
y
i
(
w
T
x
i
+
b
)
,
h
i
(
ξ
)
=
−
ξ
i
L(w,α,β)=f(w)+∑iαigi(w)+∑iβihi(ξ)
L
(
w
,
α
,
β
)
=
f
(
w
)
+
∑
i
α
i
g
i
(
w
)
+
∑
i
β
i
h
i
(
ξ
)
推导对偶问题的过程同上一篇。极值在偏导为0处取到,令:
∂L∂w=0,∂L∂b=0,∂L∂ξi=0
∂
L
∂
w
=
0
,
∂
L
∂
b
=
0
,
∂
L
∂
ξ
i
=
0
得到:
w=∑iαiyixi,∑iαiyi=0,C=αi+βi
w
=
∑
i
α
i
y
i
x
i
,
∑
i
α
i
y
i
=
0
,
C
=
α
i
+
β
i
代回原函数,得到对偶问题:
maxW(α)=∑iαi−12∑i∑jαiαjyiyjxTixj
max
W
(
α
)
=
∑
i
α
i
−
1
2
∑
i
∑
j
α
i
α
j
y
i
y
j
x
i
T
x
j
s.t.∑iαiyi=0,0≤αi≤C
s
.
t
.
∑
i
α
i
y
i
=
0
,
0
≤
α
i
≤
C
此时对应的KKT条件为:
⎧⎩⎨⎪⎪⎪⎪⎪⎪αi≥0βi≥0yi(wTx+b)≥1−ξiξi≥0αi[1−ξi−yi(wTx+b)]=0βi(−ξi)=0
{
α
i
≥
0
β
i
≥
0
y
i
(
w
T
x
+
b
)
≥
1
−
ξ
i
ξ
i
≥
0
α
i
[
1
−
ξ
i
−
y
i
(
w
T
x
+
b
)
]
=
0
β
i
(
−
ξ
i
)
=
0
可以看到,最终需要求解的W(α)
W
(
α
)
与之前形式是一致的,不同的只是约束条件的变化。根据KKT条件对αi
α
i
进行讨论:
当αi>0
α
i
>
0
,有yi(wTx+b)≥1−ξi
y
i
(
w
T
x
+
b
)
≥
1
−
ξ
i
,xi
x
i
为支持向量
当αi<C
α
i
<
C
,有βi>0
β
i
>
0
,推得ξi=0
ξ
i
=
0
,xi
x
i
在边界上
当αi=C
α
i
=
C
,有βi=0
β
i
=
0
,此时ξi
ξ
i
大小不确定。当ξi>1
ξ
i
>
1
时,该样本被错误分类;当0≤ξi≤1
0
≤
ξ
i
≤
1
,该样本在“楚河汉界内部”,被正确分类。