1. 线性可分支持向量机
1.1 训练集: T={ (x1,y1),(x2,y2),...,(xN,yn=N)},xi∈Rn,yi∈{ −1,1}
1.2 如果存在 Rn 中的超平面能将 T 中的正例点和负例点分开, 我们就说
1.3 给定线性可分训练集 T , 通过间隔最大化策略或求解等价的凸二次优化问题得到的分离超平面
f(x)=sign(w⋅x+b)
被称为
线性可分支持向量机, 其中
x,w∈Rn,b∈R
1.4 设 (w,b) 是 T 上的分离超平面, 定义
γ=|w⋅xi+b||w|=yi(w⋅xi+b)|w|
, 并且满足上述等式的点至少有一对
xi,xj
且
yi∗yj=−1
.
1.5 所谓的间隔最大化策略就是寻找 (w,b) 使 γ 达到最大, 为此可表述为一个最优化问题:
maxw,b γs.t.yi(w⋅xi+b)|w|≥γ,i=1,2,...,N
评论: 遗憾的是, 这个问题并不是一个凸优化问题, 为了使用凸优化的理论, 我们需要把(1.5)转化成凸优化问题.
1.6现在设
γ^=|w|γ
原问题转化为:
maxw,b γ^|w|s.t. yi(w⋅xi+b)≥γ^,i=1,2,...,N
注意到
γ^
的取值不会影响原问题的解(生成的分离超平面是一样的), 因此我们取
γ^=1
于是问题变为:
maxw,b 1|w|s.t. y