对偶问题和KKT条件

最新推荐文章于 2024-05-16 17:30:38 发布

顾耒之

最新推荐文章于 2024-05-16 17:30:38 发布

阅读量529

点赞数

分类专栏：机器学习西瓜书文章标签：机器学习

本文链接：https://blog.csdn.net/jiang1350/article/details/125723345

版权

机器学习西瓜书专栏收录该内容

8 篇文章 2 订阅

订阅专栏

对偶问题和KKT条件

对偶问题
KKT条件

在求解支持向量机时，我们遇到了求解约束问题
$\max_{w,b}\mid\mid w\mid\mid^2 \tag{10}$

s.t. $y_i(w^Tx_i+b)\geq 1$

对偶问题

对于一般的约束优化问题
$\min f(x)\\ s.t. \qquad \qquad g_i(x)\leq 0 \qquad i=1,2,...,m \\ \quad \quad \quad \quad \qquad \eta_j(x)=0 \qquad j=1,2,...,m$

拉格朗日函数为
$L(x,\mu ,\lambda)=f(x)+\sum_{i=1}^m\mu_ig_i(x)+\sum_{j=1}^m\lambda_j\eta_j(x)$

其中 $\mu=(\mu_1,\mu_2,...,\mu_m)^T,\lambda=(\lambda_1,\lambda_2,...,\lambda_m)^T$ 为拉格朗日乘子。

定义拉格朗日对偶函数 $\Gamma(\mu,\lambda)$ 为 $L(x,\mu ,\lambda)$ 关于x的下确界（即最小值），
$\Gamma(\mu,\lambda)=\inf_{x \in D}L(x,\mu,\lambda)=\inf_{x \in D}(f(x)+\sum_{i=1}^m\mu_ig_i(x)+\sum_{j=1}^m\lambda_j\eta_j(x))$
其拥有两个性质：

无论上述优化是否为凸优化问题，其对偶函数 $\Gamma(\mu,\lambda)$ 恒为凸函数，对偶问题为凸优化问题。
当 $\mu \geq 0$ 时， $\Gamma(\mu,\lambda)$ 构成了上述优化问题最优值 $p^*$ 的下界

定义在满足 $\mu \geq 0$ 这个约束条件下对偶函数最大值的优化问题为拉格朗日对偶问题
$\qquad \qquad\max\Gamma(\mu,\lambda)\\ s.t. \quad \mu \geq 0$

最优值为 $d^*$ ，强对偶性成立，则对偶问题的最优值即为主问题的最优解。

强对偶性要求：

主问题为凸优化
在主问题的可行集存在一点使所有的不等式约束的不等号成立。

KKT条件

设 $f(x),g_i(x),h_j(x)$ 一阶偏导连续， $x^*,(\mu^*,\lambda^*)$ 分别为主问题和对偶问题的最优解，若强对偶性成立，则 $x^*,\mu^*,\lambda^*$ 满足
$\begin{cases} \nabla_xL(x^*,\mu^*,\lambda^*)= \nabla f(x^*)+\sum_{i=1}^m\mu_i^*\nabla g_i(x^*)+\sum_{j=1}^m\lambda_j^*\nabla \eta_j(x^*) \\ g_j(x^*) \leq 0\\ h_j(x^*)=0 \\ \mu_i^* \geq 0\\ \mu_i^*g_i(x^*)=0 \end{cases}$