[凸优化]2-对偶与最优性条件

最新推荐文章于 2024-02-22 17:54:54 发布

莯风

最新推荐文章于 2024-02-22 17:54:54 发布

阅读量299

点赞数

分类专栏：凸优化

本文链接：https://blog.csdn.net/weixin_47667221/article/details/117585804

版权

凸优化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第二章对偶与最优性条件

标准形式优化问题

$\begin{aligned} \underset{x}{\min}\ &f_0(x)\\ s.t.\ &f_i(x)\leq0,i=1,2,\cdots,m\\ &h_i(x)=0,i=1,2,\cdots,p\\ &x\in D \end{aligned}$

目标函数 $f_0:\R^n\rightarrow\R$
不等式约束函数 $f_i:\R^n\rightarrow\R,i=1,2,\cdots,m$
等式约束函数 $h_i:\R^n\rightarrow\R,i=1,2,\cdots,p$
$D=(\bigcap^m_{i=0}domf_i)\cap(\bigcap_{i=1}^pdomh_i)$ 非空
最优值 $p^*$

拉格朗日对偶

对不等式约束 $f_i(x)\leq0$ 引入拉格朗日乘子 $\lambda_i$ ，对等式约束引入拉格朗日乘子 $\upsilon_i$ 。记 ${\lambda}=[\lambda_1,\lambda_2,\cdots,\lambda_,]^T\in\R^m,{\upsilon}=[\upsilon_1,\upsilon_2,\cdots,\upsilon_p]^T\in\R^p$
拉格朗日函数： $L:\R^n\times\R^m\times\R^p\rightarrow\R$ ，

$L(x,\pmb{\lambda},\pmb{\upsilon})=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^p\upsilon_ih_i(x),\ domL=D\times\R^m\times\R^p$
拉格朗日对偶函数： $g:\R^m\times\R^p\rightarrow\R$ ，
$g(\pmb{\lambda},\pmb{\upsilon})=\underset{x\in D}{\inf}L(x,\pmb{\lambda},\pmb{\upsilon})=\underset{x\in D}{\inf}[f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^p\upsilon_ih_i(x)]$

定理 1：拉格朗日对偶函数 $g({\lambda},{\upsilon})=\underset{x\in D}{\inf}L(x,{\lambda},{\upsilon})$ 是凹函数

定理 2：对任意的 ${\lambda}\geq0$ 和 ${\upsilon}$ ，对偶函数 $g({\lambda},{\upsilon})$ 是优化问题最优值 $p^*$ 的下界，即 $\forall{\lambda}\geq0,g({\lambda},{\upsilon})\leq p^*$ 。

推论： $p^*\geq\underset{{\lambda}\geq0}{\max}g({\lambda},{\upsilon})$ ，即 $p^*\geq\underset{{\lambda}\geq0}{\max}\underset{x\in D}{\min}L(x,{\lambda},{\upsilon})$

拉格朗日对偶问题:

$\begin{aligned} \underset{\pmb{\lambda},\pmb{\upsilon}}{\max}\ & g(\pmb{\lambda},\pmb{\upsilon})\\ s.t.\ &\pmb{\lambda}\geq0 \end{aligned}$

对偶可行解 $({\lambda},{\upsilon})$ 需满足： $\lambda\geq0$ 且 $({\lambda},{\upsilon})\in dom\ g$
拉格朗日对偶问题是凸优化问题
- $({\lambda}^*,{\upsilon}^*)$ ：对偶最优解或最优拉格朗日乘子
- 最优值 $d^*$

弱对偶与强对偶

对于任意的函数优化问题， $\underset{x\in D}{\inf}\underset{\lambda\geq0}{\sup}L(x,\lambda,\upsilon)\geq\underset{\lambda\geq0}{\sup}\underset{x\in D}{\inf}L(x,\lambda,\upsilon)$ 成立
弱对偶（Weak Duality）： $d^*\leq p^*$ ，即 $\underset{\lambda\geq0}{\max}\underset{x\in D}{\min}L(x,\lambda,\upsilon)\leq\underset{x\in D}{\min}\underset{\lambda\geq0}{\max}L(x,\lambda,\upsilon)$
- 总是成立
- 最优对偶间隙： $p^*-d^*\geq0$
强对偶（Strong Duality）： $d^*=p^*$ ，即 $\underset{\lambda\geq0}{\max}\underset{x\in D}{\min}L(x,\lambda,\upsilon)=\underset{x\in D}{\min}\underset{\lambda\geq0}{\max}L(x,\lambda,\upsilon)$
- 一般情况下不成立
- 对凸优化问题成立（通常）

强对偶性和 Slater’s 约束品性

Slater 约束品性：存在集合 $D$ 的一个内点 $x_0$ ，使得 $f_i(x_0)<0(i=1,2,\cdots,m),Ax_0=b$
凸优化问题，若 Slater 约束品性满足，则强对偶性成立

几何解释

最优性条件

原问题

$\begin{aligned} \underset{x}{\min}\ &f_0(x)\\ s.t.\ &f_i(x)\leq0,i=1,2,\cdots,m\\ &h_i(x)=0,i=1,2,\cdots,p\\ &x\in D \end{aligned}$
对偶问题
$\begin{aligned} \underset{\pmb\lambda,\pmb\upsilon}{\max} \ &g(\pmb\lambda,\pmb\upsilon)\\ s.t.\ &\pmb\lambda\geq0 \end{aligned}$

原问题可行解 $x$ 与对偶可行解 $(\lambda,\upsilon)$ 的对偶间隙 $\epsilon=f_0(x)-g(\lambda,\upsilon)$ ，此时称 $x$ 是 $\epsilon$ -次优的，即

$f_0(x)-p^*\leq f_0(x)-g(\pmb\lambda,\pmb\upsilon)\Rightarrow f_0(x)-p^*\leq\epsilon$
一对原问题可行解 𝑥 与对偶可行解 $(\lambda,\upsilon)$ 将原问题（对偶问题）的最优解限制在一个区间上，即

$p^*\in[g(\pmb\lambda,\pmb\upsilon),f_0(x)],\ d^*\in[g(\pmb\lambda,\pmb\upsilon),f_0(x)]$
非启发式停止准则：令可行解 $x^k$ 及对偶可行解 $(\lambda^k,\upsilon^k),k=1,2,\cdots$ ，绝对精度 $\epsilon_{abs}>0$ ，停止准则
$f_0(x)-g(\pmb\lambda^k,\pmb\upsilon^k)\leq\epsilon_{abs}$

Karush-Kuhn-Tucker(KKT)方程

假设原问题与对偶问题最优解可取得，分别为 $x^*$ 和 $(\lambda^*,\upsilon^*)$ ，且强对偶性成立，则

$\begin{aligned} f_0(x^*) &=g(\pmb\lambda^*,\pmb\upsilon^*)\\ &=\underset{x\in D}{\min} f_0(x) + \sum_{i=1}^{m} \lambda_i^*f_i(x)+\sum_{i=1}^{p}\upsilon_i^*h_i(x)\\ &=f_0(x^*)+\sum_{i=1}^{m}\lambda_i^*f_i(x)+\sum_{i=1}^{p}\upsilon_i^*h_i(x)\\ &=f_0(x^*) \end{aligned}$

根据如上推导过程，可以得到如下KKT 方程：

$\begin{aligned} f_i(x^*)\leq0,\ &i=1,2,\cdots,m\\ \lambda_i^*f_i(x^*)=0,\ &i=1,2,\cdots,m\\ \lambda_i^*\geq0,\ &i=1,2,\cdots,m\\ h_i(x^*)=0,\ &i=1,2,\cdots,p\\ \nabla f_0(x^*)+\sum_{i=1}^m\lambda_i^*\nabla f_i(x^*)+&\sum_{i=1}^k\upsilon_i^*\nabla h_i(x^*)=0 \end{aligned}$

对于目标函数和约束函数可微的任意优化问题，若强对偶性成立（对偶间隙为 0），则任意一对原问题最优解和对偶问题最优解必须满足 KKT 条件。
目标函数和约束函数可微的任意凸函数问题，任意满足 KKT 条件的点分别是原、对偶最优解且对偶间隙为零
若对偶间隙为 0，则解凸优化问题等价于解相应的 KKT 方程
定理：若 $\widetilde x,\widetilde{\lambda},\widetilde{\upsilon}$ 满足凸优化问题的 KKT 条件，则 $\widetilde x,(\widetilde{\lambda},\widetilde{\upsilon})$ 分别是原问题和对偶问题的最优解且对偶间隙为 0

通过解对偶问题求解原问题

假设：强对偶性成立且 $x^*$ 是原问题的最优解， $(\lambda^*,\upsilon^*)$ 为对偶问题的最优解，则

对于凸优化问题，若 $L(x,\lambda^*,\upsilon^*)$ 是 $x$ 的严格凸函数，拉格朗日函数 $L(x,\lambda^*,\upsilon^*)$ 关于 $x$ 求极小值时在 $x^*$ 处取得最小值，下列优化问题的解唯一
$\underset{x\in D}{\min} f_0(x)+\sum_{i=1}^m\lambda_i^*f_i(x)+\sum_{i=1}^p\upsilon_i^*h_i(x)$

强弱对偶性的极大极小描述

极大极小不等式：对于任意函数 $f:\R^n\times\R^m\rightarrow\R$ 以及任意的 $W\sube\R^n$ 和 $Z\sube\R^m$ ，有

$\underset{z\in Z}{\sup}\underset{w\in W}{\inf} f(w,z)\leq\underset{w\in W}{\inf}\underset{z\in Z}{\sup} f(w,z)$
若上式等号成立，则称 $f$ （以及 $W$ 和 $Z$ ）满足强极大极小性质或者鞍点性质
鞍点：若 $\forall w\in W,z\in Z,f(\widetilde w,z)\leq f(\widetilde w,\widetilde z)\leq f(w,\widetilde z)$ ，则称 $\widetilde w\in W,\widetilde z\in Z$ 是函数 $f$ 的鞍点
如果 $x^*$ 和 $(\lambda^*,\upsilon^*)$ 分别是原问题和对偶问题的最优解且强对偶性成立，则它们是拉格朗日函数的一个鞍点
反过来，如果 $x^*$ 和 $(\lambda^*,\upsilon^*)$ 是拉格朗日函数 $L(x,\lambda,\upsilon)$ 的一个鞍点，那么 $x^*$ 是原问题的最优解， $(\lambda^*,\upsilon^*)$ 是对偶问题的最优解，且对偶间隙为零。

支撑向量机：Support Vector Machines(SVM)

参考文章支持向量机（SVM）——原理篇 - 知乎 (zhihu.com)

莯风

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[凸优化]2-对偶与最优性条件

第二章对偶与最优性条件标准形式优化问题min⁡x f0(x)s.t. fi(x)≤0,i=1,2,⋯ ,mhi(x)=0,i=1,2,⋯ ,px∈D\begin{aligned}\underset{x}{\min}\ &f_0(x)\\s.t.\ &f_i(x)\leq0,i=1,2,\cdots,m\\&h_i(x)=0,i=1,2,\cdots,p\\&x\in D\end{aligned}xmin s.t. 
复制链接

扫一扫