一、概念
已知训练数据集
T={(x1,y1),(x2,y2),......,(xN,yN)}
分离超平面: y(x)=wx+b
(1)样本点 (xi,yi) 到分割超平面的函数间隔: r¯i=yi(wxi+b)
(2)数据集
T
到分割超平面的函数间隔:
(3)样本点
(xi,yi)
到分割超平面的几何间隔:
r=yi(w||w||xi+b||w||)
(4)数据集
T
到分割超平面的几何间隔:
二、问题描述转化
我们求一个几何间隔最大的分离超平面:
即
max r
使得
yi(w||w||xi+b||w||)>=r=min ri
进一步化简得:
max r¯||w||
使得
yi(w||w||xi+b||w||)>=r¯||w||=minr¯i||w||
即
max r¯||w||
使得
yi(wxi+b)>=r¯=min r¯i
即
max 1||w||
使得
yi(wxi+b)>=1
即
max 1||w||
使得
yi(wxi+b)−1>=0
即
min 12||w||2
使得
yi(wxi+b)−1>=0
三、最后利用拉格朗日求解这个问题即可!