数学基础
1. 间隔与支持向量
- 给定训练样本集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } , y i ∈ { − 1 , + 1 } D= \{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\},y_i\in \{- 1,+1\} D={(x1,y1),(x2,y2),...,(xm,ym)},yi∈{−1,+1}
- 找到一个划分超平面
w
T
x
+
b
=
0
w^Tx+b =0
wTx+b=0 满足以下 3 个条件:第1个是能正确划分正负样本,第2个是要位于正负样本正中间,第3个是离正负样本都尽可能远
- w = ( w 1 ; w 2 ; . . . ; w d ) w=(w_1;w_2;...;w_d) w=(w1;w2;...;wd) 为法向量,决定了超平面的方向
- b b b 为位移项,决定了超平面与原点之间的距离
- 样本空间中任意点 x x x 到超平面 ( w , b ) (w,b) (w,b) 的距离: r = ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ r=\frac{|w^Tx+b|}{||w||} r=∣∣w∣∣∣wTx+b∣
- 由条件 1:超平面能将训练样本正确分类,则有:
对于 ( x i , y i ) ∈ D , { w T x i + b > 0 , y i = + 1 w T x i + b < 0 , y i = − 1 对于(x_i,y_i)\in D,\begin{cases} & w^Tx_i+b>0 \text{ , } y_i=+1\\ & w^Tx_i+b<0\text{ , } y_i=-1 \end{cases} 对于(xi,yi)∈D,{wTxi+b>0 , yi=+1wTxi+b<0 , yi=−1 - 由条件 2:设正样本点
x
∗
+
x_*^+
x∗+和负样本点
x
∗
−
x_*^-
x∗−到超平面的距离最近,则两者相等,即:
∣
w
T
x
∗
+
+
b
∣
∣
∣
w
∣
∣
=
∣
w
T
x
∗
−
+
b
∣
∣
∣
w
∣
∣
\frac{|w^Tx_*^++b|}{||w||}=\frac{|w^Tx_*^-+b|}{||w||}
∣∣w∣∣∣wTx∗++b∣=∣∣w∣∣∣wTx∗−+b∣
有: { ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ ≥ ∣ w T x ∗ + + b ∣ ∣ ∣ w ∣ ∣ , y i = + 1 ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ ≥ ∣ w T x ∗ − + b ∣ ∣ ∣ w ∣ ∣ , y i = − 1 \begin{cases} & \frac{|w^Tx+b|}{||w||}\ge \frac{|w^Tx_*^++b|}{||w||} \text{ , } y_i=+1\\ & \frac{|w^Tx+b|}{||w||}\ge \frac{|w^Tx_*^-+b|}{||w||}\text{ , } y_i=-1 \end{cases} ⎩ ⎨ ⎧∣∣w∣∣∣wTx+b∣≥∣∣w∣∣∣wTx∗++b∣ , yi=+1∣∣w∣∣∣wTx+b∣≥∣∣w∣∣∣wTx∗−+b∣ , yi=−1;
去绝对值后伸缩系数得: { w T x i + b ≥ + 1 , y i = + 1 w T x i + b ≤ − 1 , y i = − 1 \begin{cases} & w^Tx_i+b\ge +1 \text{ , } y_i=+1\\ & w^Tx_i+b\le -1 \text{ , } y_i=-1 \end{cases} {wTxi+b≥+1 , yi=+1wTxi+b≤−1 , yi=−1
此时 w T x ∗ + + b = 1 , w T x ∗ − + b = − 1 w^Tx_*^++b=1,w^Tx_*^-+b=-1 wTx∗++b=1,wTx∗−+b=−1- 支持向量:称 x ∗ + , x ∗ − x_*^+,x_*^- x∗+,x∗− 为支持向量,两点到超平面的距离均为 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1,
- 间隔:两个异类支持向量到超平面的距离之和为 γ = 2 ∣ ∣ w ∣ ∣ \gamma=\frac{2}{||w||} γ=∣∣w∣∣2
- 由条件 3:通过“最大化间隔”来保证超平面离正负样本都尽可能远,即:
$$