目标:SVM模型是为求得使几何间隔最大的超平面: y=w⋅x+b y = w · x + b
-
由点面之间的距离:
-
yi(wxi+b)||w||=γi y i ( w x i + b ) | | w | | = γ i
其中 γ γ 是几何间隔, 是超平面法向量, b b 是超平面截距, 是样本 i i 的标记。
考虑到几何问题与函数问题的关系:
因为:
γ^
γ
^
的取值不会影响上述不等式的成立,所以不妨取其为1。
注意到,
Max:1||w||⇔Min:12||w||2(对w,b参数)
M
a
x
:
1
|
|
w
|
|
⇔
M
i
n
:
1
2
|
|
w
|
|
2
(
对
w
,
b
参
数
)
等价,于是:
问题变为:
构建拉格朗日函数其中,
α=(α1,α2,α3,....αi,)T i=1,2,3...N
α
=
(
α
1
,
α
2
,
α
3
,
.
.
.
.
α
i
,
)
T
i
=
1
,
2
,
3...
N
:
根据拉格朗日对偶性,原始问题的对偶问题是 极大 极少问题:
可以分两步进行,先求L 对 w,b 的最小值,再求L对 α α 的最大值:
(1)求 :对 w,b 求偏导,令其等于0:
得到:
将(A)式代入拉格朗日函数,并使用(B)式,可以得到:
minw,bL(w,b,α)
min
w
,
b
L
(
w
,
b
,
α
)
(2)求
minw,bL(w,b,α)对α
min
w
,
b
L
(
w
,
b
,
α
)
对
α
的极大值,即对偶问题::
由对偶问题转化为:
对(11)式关于 αi α i 的偏导并令其为 0,结合约束条件可以解得 α∗ α ∗ ,
由于原始问题与对偶问题满足共解条件,所以可以使用α*代入式(A)和式(B)
求得(C)
由KKT互补条件知:
因为 w∗ w ∗ 不为0,显然有 α∗j>0 α j ∗ > 0 存在,对于这样的 α∗j α j ∗ , j j 可以使下式成立
将(C)式代入上式,可以得到:
至此,超平面求出,即:
分类决策函数可以写成