支持向量机SVM 对偶问题 SMO求解

最新推荐文章于 2024-07-25 16:05:31 发布

库奇la啦

最新推荐文章于 2024-07-25 16:05:31 发布

阅读量521

点赞数

文章标签：支持向量机机器学习人工智能

本文链接：https://blog.csdn.net/m0_70322975/article/details/130958773

版权

支持向量机SVM

SVM概述

图中红线就是最佳划分线，离红线最近两个点到分隔线的向量就是支持向量

假设数据是多维的，分隔线表达式为
$x_1a_1+x_2a_2+ ... +x_na_n+b=0$

$\begin{pmatrix} a_1\\ a_2\\ \vdots\\ a_n \end{pmatrix}^T * \begin{pmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{pmatrix}^T +b = 0$

就可以简化为 $w x + b = 0$
支持向量点到分隔线的距离 $d=\dfrac{|w^Tx+b|}{||w||}$ 要使d最大，则 $∣∣ w ∣∣$ 最小

每个点都满足 $y_i(w^Tx_i+b)\geqslant1$
所以目标函数为
$\begin{cases} \min ||w||\\ y_i(w^Tx_i+b)\geqslant1\\ \end{cases}$

利用拉格朗日定理就可以得出求解函数，如下

$L(\omega,b,\lambda) = \dfrac{1}{2}{||\omega||}^2 + \lambda_i\sum\limits_{i}(1-y_i(w^Tx_i+b)) = \dfrac{1}{2}{||\omega||}^2 + \sum\limits_{i}\lambda_i - \sum\limits_{i}\lambda_iy_i(w^Tx_i+b)$

$对L(\lambda,b,\omega)求\lambda和b的偏导，当为0时结果如下$
$\dfrac{\partial L}{\partial b} = -\sum\limits_i\lambda_iy_i=0$

$\dfrac{\partial L}{\partial \omega} = \omega - \sum\limits_i\lambda_iy_ix_i=0 \quad则\quad\omega = \sum\limits_i\lambda_iy_ix_i$

将w,b的取值代入原式 $L(\omega,b,\lambda)$ 中，则为
$L(\lambda,b,\omega) = \sum\limits_i\lambda_i - \dfrac{1}{2}\sum\limits_i\sum\limits_j\lambda_i\lambda_jy_iy_jx_i^Tx_j^T$
补充
$原问题是min(\omega,b)max(\lambda)L(\lambda,b,\omega),若满足强对偶条件条件，即可使用对偶问题求解，对偶问题是max(\lambda)min(\omega,b)L(\lambda,b,\omega)$

$强对偶条件为1.原问题为凸函数2.g(x)\quad\omega*x+b<0\quad线性条件3.满足KKT条件$

$KKT条件1.\dfrac{\partial L}{\partial x}=0\quad2.\lambda_ig_i(x)=0\quad3.g_i(x)\leqslant0\quad 4.x_i\geqslant0$

故其对偶问题为
$此时无\omega,b参数\quad max(\lambda)\quad L(\lambda,b,\omega) = \sum\limits_i\lambda_i - \dfrac{1}{2}\sum\limits_i\sum\limits_j\lambda_i\lambda_jy_iy_jx_i^Tx_j^T$

$SMO算法求max(\lambda)$

原理概要
SMO算法是一种启发式算法，基本思路为：如果所有变量的解满足此最优化问题的KKT条件，那么就得到了最优解，因为KKT条件是该最优化问题的充分必要条件。

否则，需要选择两个变量，并且固定其他变量，只针对这两个变量构建一个最优化问题，这里的两个变量一个是违反KKT条件最严重的那一个，另一个则是由约束条件确定。这样原问题就可以不断划分成若干个子问题，从而提高了整个算法的效率。
假设选择 $\lambda_1,\lambda_2$ 则求解函数为
$L(\lambda_1,\lambda_2)=\lambda_1+\lambda_2-\dfrac{1}{2}(\lambda_1^2k_{11}+2\lambda_1y_1\lambda_2y_2k_{12}+\lambda_2^2k_{22}+2\sum\limits_{j=3}\lambda_1y_1\lambda_jy_jk_{1j}+2\sum\limits_{j=3}\lambda_2y_2\lambda_jy_jk_{2j})$
补充
$K_{11}=x_1x_1,K_{1j}=x_1x_j$ 以此类推
i，j大于3时，按常数处理

由于
$\lambda_1y_1+\lambda_2y_2+\sum\limits_{i=3}\lambda_iy_i=0\quad假设\sum\limits_{i=3}\lambda_iy_i=-c$

$\lambda_1y_1+\lambda_2y_2=c\quad则\lambda_1=y_1(c-\lambda_2y_2)$
代入得
$L(\lambda_2)=y_1(c-\lambda_2y_2)+\lambda_2-\dfrac{1}{2}[(c-\lambda_2y_2)^2k_{11}+2(c-\lambda_2y_2)\lambda_2y_2k_{12}+\lambda_2^2k_{22}+2\sum\limits_{j=3}(c-\lambda_2y_2)\lambda_jy_jk_{1j}+2\sum\limits_{j=3}\lambda_2y_2\lambda_jy_jk_{2j}]$
$对L求\lambda_2求导，得$
$\dfrac{\partial L}{\partial \lambda_2}=y_2(f(x_1)-y_1-(f(x_2)-y_2)+\lambda_2^{old}y_2(K_{11}+K_{22}+2K_{12}))$
补充
$f(x_1)-y_1=E_1\quad f(x_2)-y_2=E_2\quad K_{11}+K_{22}+2K_{12}=\xi$

$则\quad \lambda_2^{new}=\lambda_2^{old}+\dfrac{y_2(E_1-E_2)}{\xi}$

手算推导过程

库奇la啦

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
支持向量机SVM 对偶问题 SMO求解

图中红线就是最佳划分线，离红线最近两个点到分隔线的向量就是支持向量假设数据是多维的，分隔线表达式为x1a1x2a2xnanb0x1a1x2a2...xnanb0a1a2⋮anT∗x1x2⋮xnTb0a_1\\a_2\\\vdots\\a_nx_1\\x_2\\\vdots\\x_na1a2⋮anT∗x1x2⋮。
复制链接

扫一扫