SVM——（四）目标函数求解

最新推荐文章于 2024-06-30 11:03:17 发布

空字符（公众号：月来客栈）

最新推荐文章于 2024-06-30 11:03:17 发布

阅读量4.1k

点赞数 1

分类专栏：机器学习文章标签：函数 svm 优化

本文链接：https://blog.csdn.net/the_lastest/article/details/78569092

版权

本文介绍了如何利用拉格朗日对偶和SMO算法解决支持向量机（SVM）的目标优化函数。首先，通过构建广义拉格朗日函数，然后求解w和b的极小值。接着，通过SMO算法求解α的最大值，从而求得超平面。最终，讨论了SMO算法在SVM优化问题中的重要性。

摘要由CSDN通过智能技术生成

在之前的两篇文章中[1][2]分别用两种方法介绍了如何求得目标优化函数，这篇文章就来介绍如何用拉格朗日对偶(Lagrange duality)问题以及SMO算法求解这一目标函数，最终得到参数。

本文主要分为如下部分：
1.构造广义拉格朗日函数 $\mathcal{L}(w,b,\alpha)$
2.关于参数 $w, b$ ,求 $\mathcal{L}$ 的极小值 $W(\alpha)$
3.使用SMO算法求 $W(\alpha)$ 的极大值
4.求解参数 $w, b$
其中2,3,4也是求解对偶问题的一般步骤。

1.构造广义拉格朗日函数 $\mathcal{L}(w,b,\alpha)$

由上文可知SVM最终的优化目标为：

$\begin{array}{l} \min_{\boldsymbol{\omega},b}\frac{1}{2}||\boldsymbol{\omega}||^2\\ ~\\ \textrm{s. t.}~ ~y_i(\boldsymbol{\omega}^T\boldsymbol{x}_i+b)\geq 1,~~i = 1,2,...,m \end{array} \tag{1.1}$

由此我们可以得到广义的拉格朗日函数为：

$\bf{Generalized\;Lagrangian}$
$\begin{aligned} &\mathcal{L}(w,b,\alpha)=\frac{1}{2}||w||^2-\sum_{i=1}^m\alpha_i\large[y^{(i)}(w^Tx^{(i)}+b)-1]\\[2ex] &s.t.\;g_i(w)=-y^{(i)}(w^Tx^{(i)}+b)+1\leq0\tag{1.2} \end{aligned}$

注：此处有两个参数 $w, b$ ,一个拉格朗日乘子向量 $\alpha$ ，且 $\alpha_i\geq0$ ，因为只有这样才能满足 $\frac{1}{2}||w||^2=\max\mathcal{L}$ ；(详见此处)

由对偶性：
$d^*=\max_{\alpha,\alpha_i\geq0}\min_{w,b}\mathcal{L}(w,b,\alpha)=\min_{w,b}\max_{\alpha,\alpha_i\geq0}\mathcal{L}(\omega,\alpha,\beta)=p^*\tag {1.3}$
可知，对偶问题 $d^*$