凸优化学习-（二十一）KKT条件

最新推荐文章于 2023-06-06 11:54:27 发布

明远湖边的秃头

最新推荐文章于 2023-06-06 11:54:27 发布

阅读量3k

点赞数 13

分类专栏： # 凸优化文章标签：深度学习

本文链接：https://blog.csdn.net/qq_40917612/article/details/105120658

版权

凸优化专栏收录该内容

30 篇文章 112 订阅

订阅专栏

凸优化学习

KKT条件是核心，我会在这一节里面讲清楚KKT的推导以及它的性质。

学习笔记

一、KKT条件的推导

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ (\text P)\qquad\text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$
拉格朗日函数( $\text{lagrangian function}$ )：
$l(x,\lambda,v)=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^pv_ih_i(x)$
由拉格朗日函数构造的对偶函数( $\text{dual function}$ )：
$g(\lambda,v)=\inf_{x\in D}l(x,\lambda,v)$
其对偶问题为：
$\begin{aligned} \max&& g(\lambda,v)&\\ (\text D)\qquad\text{s.t.}&&\lambda\ \ge0&\\ \end{aligned}\\$

我们做出两个假设：

$p^*=d^*$
所有函数可微。

那么，对于最优解 $x^*,\lambda^*,v^*$ ，必有：
$\begin{aligned} f_i(x^*)&\le0\qquad i=1,\cdots,m\\ h_i(x^*)&=0\qquad i=1,\cdots,p\\ \lambda^*&\ge0 \end{aligned}$

对于假设1，我们做如下推导：
$\begin{aligned} &&p^*&=d^*\\ \Leftrightarrow&&f_0(x^*)&=g(\lambda^*,v^*)\\ &&&=\inf_x\lbrace f_0(x)+\sum^m_{i=1}\lambda_i^*f_i(x)+\sum_{i=1}^pv_i^*h_i(x)\rbrace\\ &&&\le f_0(x^*)+\sum^m_{i=1}\lambda_i^*f_i(x^*)+\sum_{i=1}^pv_i^*h_i(x^*)\\ &&&\le f_0(x^*) \end{aligned}$
对一个式子求最小下界一定小于等于任意带一个可行解。

我们对得到的结果进行分析，发现不等式左边和右边是相等的，那么，也就意味着，所有的不等号可以改为等号。

我们得到如下式子：
$\begin{aligned} &&\sum^m_{i=1}\lambda_i^*f_i(x^*)&=0\\ \Leftrightarrow&&\lambda_i^*f_i(x^*)&=0,i=1,\cdots,m \end{aligned}$

分析得到KKT条件中的互补松弛条件（Complementary slackness）：

$\lambda^*>0\Rightarrow f_i(x^*)=0$
$f_I(x^*)<0\Rightarrow\lambda_i^*=0$

同时，也可以得到：
$\begin{aligned} &&\inf_x\lbrace f_0(x)+\sum^m_{i=1}\lambda_i^*f_i(x)+\sum_{i=1}^pv_i^*h_i(x)\rbrace&=f_0(x^*)\\ \Leftrightarrow&&\inf_xl(x,\lambda^*,v^*)&=f_0(x^*)\\ \Leftrightarrow&&\frac{\partial l(x,\lambda^*,v^*)}{\partial x}\bigg|_{x=x^*}&=0 \end{aligned}$

于是我们就推导出了KKT条件中的稳定性条件（Stationary）

$\frac{\partial l(x,\lambda^*,v^*)}{\partial x}\bigg|_{x=x^*}=0$

加入原问题可行解的约束，我们就得到了完整的KKT条件：
$\text{KKT}= \begin{cases} f_i(x^*)\le0&&i=1,\cdots,m&\text{Primal feasibility}\\ h_i(x^*)=0&&i=1,\cdots,p&\text{Primal feasibility}\\ \lambda^*\ge0&&&\text{Dual feasibility}\\ \lambda^*>0\Rightarrow f_i(x^*)=0&&&\text{Complementary slackness}\\ f_i(x^*)<0\Rightarrow\lambda_i^*=0&&&\text{Complementary slackness}\\ \frac{\partial l(x,\lambda^*,v^*)}{\partial x}\Big|_{x=x^*}=0&&&\text{Stationary} \end{cases}$

但是，这里的KKT条件只是 $p^*=d^*$ 的必要条件，此时我们用KKT解出来的解并不一定是原问题的解，我们接下去探究何时KKT为充要条件。

二、KKT条件何时是 $p^=d^$ 的充要条件

若原问题为凸问题，各个函数可微，则KKT条件为 $p^*=d^*$ 的充要条件。
证明：

只需证明充分性，设 $(x^*,\lambda^*,v^*)$ 满足KKT条件，需证：
$\begin{aligned} &&d^*&=p^*\\ \Leftrightarrow&&g(\lambda^*,v^*)&=f_0(x^*)\\ \end{aligned}$
KKT条件如下：
$\text{KKT}= \begin{cases} f_i(x^*)\le0&&i=1,\cdots,m&\text{Primal feasibility}\\ h_i(x^*)=0&&i=1,\cdots,p&\text{Primal feasibility}\\ \lambda\ge0&&&\text{Dual feasibility}\\ \lambda^*>0\Rightarrow f_i(x^*)=0&&&\text{Complementary slackness}\\ f_i(x^*)<0\Rightarrow\lambda_i^*=0&&&\text{Complementary slackness}\\ \frac{\partial l(x,\lambda^*,v^*)}{\partial x}\Big|_{x=x^*}=0&&&\text{Stationary} \end{cases}$
对于 $g(\lambda^*,v^*)$ ，有：
$\begin{aligned}&&g(\lambda^*,v^*)&=\inf_xl(x,\lambda^*,v^*)\\ 由\text{Stationary}得： &&&=l(x^*,\lambda^*,v^*)\\ &&&=f_0(x^*)+\sum^m_{i=1}\lambda_i^*f_i(x^*)+\sum_{i=1}^pv_i^*h_i(x^*)\\由\text{Primal feasibility}和\text{Complementary slackness}得：&&&=f_0(x^*) \end{aligned}$
证毕。

宏观感受KKT条件适用的范围：
在这里插入图片描述

三、解KKT条件的一个例子

二次规划：
$\begin{aligned} \min&& \frac 1 2x^T\textbf Px+q^Tx+r&\qquad\textbf P\in\textbf S_+^n\\ \text{s.t.} &&\textbf A x-b&=0\\ \end{aligned}$

其KKT条件：
$\text{KKT}= \begin{cases} \textbf G x^*-h\le0&&\text{Primal feasibility}\\ \textbf A x^*-b=0&&\text{Primal feasibility}\\ \textbf Px+q+\textbf A^Tv^*=0&&\text{Stationary} \end{cases}$
解就行了。

四、KKT条件与凸函数一阶条件的关系

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ \qquad\text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$

其一阶条件：
$\begin{cases} f_i(x)\le0&&i=1,\cdots,m&\\ h_i(x)=0&&i=1,\cdots,p&\\ \lambda\ge0&\\ x_i\big(\nabla f_0(x)\big)_i=0,&&i=1,\cdots,n&&&\\ \end{cases}$

其KKT条件：
$\text{KKT}= \begin{cases} f_i(x^*)\le0&&i=1,\cdots,m&\text{Primal feasibility}\\ h_i(x^*)=0&&i=1,\cdots,p&\text{Primal feasibility}\\ \lambda\ge0&&&\text{Dual feasibility}\\ \lambda^*>0\Rightarrow f_i(x^*)=0&&&\text{Complementary slackness}\\ f_i(x^*)<0\Rightarrow\lambda_i^*=0&&&\text{Complementary slackness}\\ \frac{\partial l(x,\lambda^*,v^*)}{\partial x}\Big|_{x=x^*}=0&&&\text{Stationary} \end{cases}$
KKT条件消除掉对偶变量 $\lambda$ 就与一阶条件等价。

个人思考

KKT条件是凸优化的核心，它使所有带约束的凸优化问题求解变得简单，同时也指明了一条解凸问题的思路。所有的算法本质都是在解KKT条件，这是学习凸优化的重中之重。

纸质笔记

在这里插入图片描述

明远湖边的秃头

关注

13
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
凸优化学习-（二十一）KKT条件

凸优化学习KKT条件是核心，我会在这一节里面讲清楚KKT的推导以及它的性质。学习笔记一、KKT条件的推导对于一个普通优化问题：min⁡f0(x)(P)s.t.fi(x)≤0i=1⋯mhi(x)=0i=1⋯p\begin{aligned} \min&& f_0(x)&\\ (\text P)\qquad\text{s.t.}&&f_i(x)&a...
复制链接

扫一扫