假设一个特征空间上的训练数据集 T = ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x N , y N ) T={(x_1, y_1), (x_2, y_2), …, (x_N, y_N)} T=(x1,y1),(x2,y2),…,(xN,yN),其中 x i ∈ R n , y i ∈ { + 1 , − 1 } , i = 1 , 2 , … , N x_i∈\R^n, y_i∈\{+1, -1\}, i = 1,2,…, N xi∈Rn,yi∈{ +1,−1},i=1,2,…,N。 x i x_i xi为第 i i i个特征向量,也称为实例, y i y_i yi为 x i x_i xi的类标记。学习目标是在特征空间中赵找到一个分离超平面,能将实例分到不同的类。
线性可分支持向量机的定义:
给定线性可分训练数据集,通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面为 w ∗ ⋅ x + b ∗ = 0 w^*·x + b^* =0 w∗⋅x+b