一、线性分类支持向量机
1、参考标准:
①错分样本数目最少→错分训练样本最少
缺陷:对判别函数的好坏评估不精细(同一数量可能有好多判别函数)、满足的判别函数未必就好(易受异常点影响)
→②支持向量机的标准:margin最大,两类样本到分类面的最短距离之和最大
分类面: f ( x ) = < w ~ , x i > + b ~ { > 0 , if y i is 1 < 0 , if y i is -1 f(x)=<\tilde{w},x_{i}>+\tilde{b}\begin{cases}>0, & \text{if $y_{i}$ is 1} \\<0, & \text{if $y_{i}$ is -1} \end{cases} f(x)=<w~,xi>+b~{>0,<0,if yi is 1if yi is -1
概念:样例
(
x
i
,
y
i
)
(x_{i},y_{i})
(xi,yi) 对应于超平面(w,b)的(函数的)间隔是量:
γ
i
=
y
i
(
<
w
~
,
x
i
>
+
b
~
)
{
>
0
,
(
x
i
,
y
i
)
正确分类
<
0
,
(
x
i
,
y
i
)
未正确分类
\gamma_{i}=y_{i}(<\tilde{w},x_{i}>+\tilde{b})\begin{cases}>0, & \text{$(x_{i},y_{i})$ 正确分类} \\<0, & \text{ $(x_{i},y_{i})$ 未正确分类} \end{cases}
γi=yi(<w~,xi>+b~){>0,<0,(xi,yi) 正确分类 (xi,yi) 未正确分类
当权重向量为单位向量时,几何间隔等价于函数间隔,故:
对于有限个数样本,存在
ε
,
s
.
t
.
y
i
(
<
w
~
,
x
i
>
+
b
~
)
≥
ε
\varepsilon ,s.t. \quad y_{i}(<\tilde{w},x_{i}>+\tilde{b})≥\varepsilon
ε,s.t.yi(<w~,xi>+b~)≥ε
即
y
i
(
<
w
,
x
i
>
+
b
)
≥
1
,
∀
i
y_{i}(<w,x_{i}>+b)≥1,\forall i\quad
yi(<w,xi>+b)≥1,∀i 其中
w
=
w
~
/
ε
,
b
=
b
~
/
ε
,
w
,
b
不
是
单
位
向
量
!
w=\tilde{w}/\varepsilon,b=\tilde{b}/\varepsilon, \\w,b不是单位向量!
w=w~/ε,b=b~/ε,w,b不是单位向量!
若将分类面(w,b)对应的margin记为 ρ ( w , b ) , 则 ρ ( w , b ) = 2 ∣ ∣ w ∣ ∣ \rho(w,b),则\rho(w,b)=\frac{2}{||w||} ρ(w,b),则ρ(w,b)=∣∣w∣∣2
→给定训练样本集 {
(
x
1
,
y
1
)
,
.
.
.
,
(
x
l
,
y
l
)
,
y
i
∈
(x_{1},y_{1}),...,(x_{l},y_{l}),y_{i} \in {}
(x1,y1),...,(xl,yl),yi∈{+1,-1}},利用线性SVM求解线性分类面本质上是求解如下优化问题:
优化目标:
m
i
n
Φ
(
w
,
b
)
=
1
2
<
w
,
w
>
min\Phi(w,b)=\frac{1}{2}<w,w>
minΦ(w,b)=21<w,w>
约束条件:
y
i
(
<
w
,
x
i
>
+
b
)
≥
1
,
i
=
1
,
2
,
.
.
.
,
l
y_{i}(<w,x_{i}>+b)≥1,i=1,2,...,l
yi(<w,xi>+b)≥1,i=1,2,...,l
二、非线性分类支持向量机
三、再生核希尔伯特空间
四、其他相关内容