凸优化学习-（十八）对偶性Duality 拉格朗日函数与对偶函数

最新推荐文章于 2023-08-11 14:05:40 发布

明远湖边的秃头

最新推荐文章于 2023-08-11 14:05:40 发布

阅读量2.4k

点赞数 4

分类专栏： # 凸优化文章标签：深度学习

本文链接：https://blog.csdn.net/qq_40917612/article/details/105010504

版权

凸优化专栏收录该内容

30 篇文章 114 订阅

订阅专栏

凸优化学习

对偶性是凸优化学习的核心，重中之重。

学习笔记

一、拉格朗日函数与对偶函数

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ \text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$
由此问题定义的拉格朗日函数( $\text{lagrangian function}$ )：
$l(x,\lambda,v)=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^pv_ih_i(x)$
其中 $\lambda,v$ 被称为拉格朗日乘子，分别为与等式相关的拉格朗日乘子和与不等式相关的拉格朗日乘子。
由拉格朗日函数构造的对偶函数( $\text{dual function}$ )：
$g(\lambda,v)=\inf_{x\in D}l(x,\lambda,v)$

二、对偶函数的性质

1、对偶函数一定是凹函数

线性函数组合的 $\inf$ 一定是凹函数。
线性函数组合的 $\sup$ 一定是凸函数。

2、 $g(\lambda,v)\le p^*$

*证明：*设 $x^*$ 是原问题最优解，则必是可行解。
则 $\begin{aligned} l(x^*,\lambda,v)&=f_0(x^*)+\sum_{i=1}^m\lambda_if_i(x^*)+0\\ &\le p^* \end{aligned}$
而 $g$ 是 $l$ 的下界，故有
$g(\lambda,v)\le l(x^*,\lambda,v)\le p^*$
所以，极大化 $g$ ，可以得到 $p^*$ 的最好下界。而 $g$ 是凹的，极大化 $g$ 是一个凸问题，这为我们解非凸问题提供了一种思路。

三、几个求拉格朗日函数和对偶函数的例子

例1：二次规划

$\begin{aligned} &&\min\qquad& x^Tx\\ &&\text{s.t.}\qquad&\textbf Ax-b=0\\ \\ \Rightarrow&&l(x,v)&=x^Tx+v(\textbf Ax-b)\\ \Rightarrow&&g(v)&=\inf_x l(x,v)\\ &&&=\inf_x x^Tx+v^T\textbf Ax-v^Tb \end{aligned}$

例2：线性规划

$\begin{aligned} &&\min\qquad& c^Tx\\ &&\text{s.t.}\qquad&\textbf Ax-b=0\\ &&\qquad&\qquad \ \ x\ge0\\ \\ \Rightarrow&&l(x,\lambda,v)&=c^Tx-\lambda^Tx+v^T(\textbf Ax-b)\\ &&&=-b^Tv+(c+\textbf A^Tv-\lambda)^Tx\\ \Rightarrow&&g(v)&=\inf_x l(x,\lambda,v)\\ &&&=\begin{cases} -b^Tv&\textbf A^Tv-\lambda+c=0\\ -\infty&\text{otherwise} \end{cases} \end{aligned}$

例3：非凸约束的二次规划

$\begin{aligned} &&\min\qquad& x^T\textbf Wx\\ &&\text{s.t.}\qquad&x_i=\lbrace-1,1\rbrace\qquad i=1\cdots m \\ \\ \Leftrightarrow&&\min\qquad& x^T\textbf Wx\\ &&\text{s.t.}\qquad&x_i^2-1=0\qquad \ \ \ \ i=1\cdots m \\ \Rightarrow&&l(x,\lambda,v)&=x^T\textbf Wx+\sum_{i=1}^nv_i(x_i^2-1)\\ &&&=x^T\big(\textbf W+\text{Diag}(v)\big)x-1^Tv \\ \Rightarrow&&g(v)&=\inf_x l(x,\lambda,v)\\ &&&=\begin{cases} -1^Tv&\textbf W+\text{Diag} (v)\succeq0\\ -\infty&\text{otherwise} \end{cases} \end{aligned}$

四、对偶问题（ $\text{Dual problem}$ ）

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ \text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$
拉格朗日函数( $\text{lagrangian function}$ )：
$l(x,\lambda,v)=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^pv_ih_i(x)$
由拉格朗日函数构造的对偶函数( $\text{dual function}$ )：
$g(\lambda,v)=\inf_{x\in D}l(x,\lambda,v)$
其对偶问题为：
$\begin{aligned} \max&& g(\lambda,v)&\\ \text{s.t.}&&\lambda\ \ge0&\\ \end{aligned}\\$

例1：线性规划

$\begin{aligned} &&\min\qquad& c^Tx\\ (P)&&\text{s.t.}\qquad&\textbf Ax-b=0\\ &&\qquad&\qquad \ \ x\ge0\\ \\ \Rightarrow&&l(x,\lambda,v)&=c^Tx-\lambda^Tx+v^T(\textbf Ax-b)\\ &&&=-b^Tv+(c+\textbf A^Tv-\lambda)^Tx\\ \Rightarrow&&g(v)&=\inf_x l(x,\lambda,v)\\ &&&=\begin{cases} -b^Tv&\textbf A^Tv-\lambda+c=0\\ -\infty&\text{otherwise} \end{cases}\\ \\ &&\max\qquad& -b^Tx\\ \Rightarrow(D)&&\text{s.t.}\qquad&\lambda\ge0\\ &&&\textbf A^Tv-\lambda+c=0 \end{aligned}$

个人思考

对偶性是整个凸优化学习的核心，这是我们第一次接触到能给出一个非凸优化问题的最优下界的方法，同时，凸优化问题的对偶也有着良好的性质，需要接下来深入学习。
这里面拉格朗日乘子和之前的多目标优化中的惩罚因子有些相似。

纸质笔记

在这里插入图片描述

明远湖边的秃头

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
凸优化学习-（十八）对偶性Duality 拉格朗日函数与对偶函数

凸优化学习对偶性是凸优化学习的核心，重中之重。学习笔记一、拉格朗日函数与对偶函数对于一个普通优化问题：min⁡f0(x)s.t.fi(x)≤0i=1⋯mhi(x)=0i=1⋯p\begin{aligned} \min&& f_0(x)&\\ \text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ ...
复制链接

扫一扫