1,前提条件:在所给数据集完全线性可分时才能应用此模型,属于较理论的情况,实际的数据不大可能完全分开。
2,待解决问题(二分类问题):
有线性可分数据集
T
=
{
(
x
1
,
y
1
)
,
(
x
2
,
y
2
)
,
.
.
.
,
(
x
N
,
y
N
)
}
,
其
中
x
i
∈
R
n
,
y
i
∈
{
−
1
,
1
}
,
i
=
1
,
2
,
.
.
.
,
N
T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\},其中x_i\in R^n,y_i \in \{-1,1\},i=1,2,...,N
T={(x1,y1),(x2,y2),...,(xN,yN)},其中xi∈Rn,yi∈{−1,1},i=1,2,...,N
要求找到最大间隔超平面将数据集分为两类。
。。。
略有所思:最大间隔有两个方式理解,一个是一个板(超平面)离所有点的距离最大,如下图:
二个是想象两类边上各有一个板,这两板平行,要使它们间的距离最大,如下图:
。。。
3,将上述问题转化为约束最优化问题
4,解上述问题的对偶问题
5,最大间隔超平面的通用求法
S1 最大间隔超平面的存在性和唯一性论证
Reference
《统计学习方法》李航