支持向量机2
在上一篇中,我们由于要最大化间隔故推导出最终要处理的公式为
(2.1) m i n ω , b 1 2 ∣ ∣ ω ∣ ∣ 2 y i ( ω T x i + b ) > = 1 , i = 1 , 2 , 3... m . min_{\omega,b}\frac{1}{2}{||\omega||^2}\\ y_i(\omega^Tx_i+b)>=1,i=1,2,3...m. \tag{2.1} minω,b21∣∣ω∣∣2yi(ωTxi+b)>=1,i=1,2,3...m.(2.1)
下面我们的目的就是求解 ω , b \omega,b ω,b使得上式子成立。
对偶问题
为什么要使用对偶问题来求解 ω , b \omega,b ω,b?
- 不等式的约束一直是优化里的难题,求解对偶问题可以将原来的不等式约束问题变成等式约束。
- 支持向量机用到了高维映射,但是映射函数的具体形式几乎完全不确定,而求解对偶问题之后,可以用核函数来处理这个问题。
原始问题是:
(2.1) m i n ω , b 1 2 ∣ ∣ ω ∣ ∣ 2 y i ( ω T x i + b ) > = 1 , i = 1 , 2 , 3... m . min_{\omega,b}\frac{1}{2}{||\omega||^2}\\ y_i(\omega^Tx_i+b)>=1,i=1,2,3...m. \tag{2.1} minω,b21∣∣ω∣∣2yi(ωTxi+b)>=1,i=1,2,3...m.(2.1)
则该问题的拉格朗日函数:
(2.2) L ( ω , b , α ) = 1 2 ∣ ∣ ω ∣ ∣ 2 + ∑ i = 1 m α i ( 1 − y i ( ω T x i + b ) ) L(\omega,b,\alpha)\ =\ \frac{1}{2}||\omega||^2+\sum_{i=1}^{m}\alpha_i(1-y_i(\omega^Tx_i+b))\tag{2.2} L(ω,b,α) = 21∣∣ω∣∣2+i=1∑mαi(1−yi(ωTxi+b))(2.2)
可以让原始问题等价于:
(2.3) S V M ≡ min b , ω ( max a l l α ≥ 0 L ( ω , b , α ) ) SVM \equiv \min \limits_{b,\omega}\left (\max \limits_{all \ \alpha \ge 0}L(\omega,b,\alpha)\right )\tag{2.3} SVM≡b,ωmin(all α≥0maxL(ω,b,α)