拉格朗日对偶性Duality and the Lagrangian

最新推荐文章于 2024-09-16 21:22:47 发布

阿素.(◍•ᴗ•◍)

最新推荐文章于 2024-09-16 21:22:47 发布

阅读量1.2k

点赞数 1

分类专栏：凸优化文章标签：线性代数概率论算法拉格朗日乘子法

本文链接：https://blog.csdn.net/weixin_45008608/article/details/120535867

版权

凸优化专栏收录该内容

9 篇文章 2 订阅

订阅专栏

本文详细介绍了如何利用拉格朗日对偶性将约束最优化问题转化为对偶问题。通过建立广义拉格朗日函数，讨论了原始问题与对偶问题的关系，包括它们的最优值关系以及KKT条件。当原始问题满足特定条件时，两者解相等。内容涵盖了凸函数、仿射函数和严格可行性等概念。

摘要由CSDN通过智能技术生成

利用拉格朗日对偶性（Lagrange duality）将原始问题转换为对偶问题，通过解对偶问题而得到原始问题的解。

原始问题
考虑原始问题：
假设 $f (x)$ 、 $c_i(x)$ 、 $h_j(x)$ 是定义在 $\mathbf{R}^n$ 上的连续可微函数，考虑约束最优化问题
$\begin{aligned}\min_{x\in \mathbf{R}^n}\quad &f(x)\\ s.t. \quad & c_i(x)\leq 0,\quad i=1,2,\cdots,k\\ & h_j(x)=0, \quad j=1,2,\cdots,l \end{aligned}$

首先，我们引入广义拉格朗日函数(generalized Lagrange function)
$L(x,\alpha,\beta)=f(x)+\sum_{i=1}^k \alpha_ic_i(x)+\sum_{j=1}^l \beta_jh_j(x)$

其中 $x=(x^{(1)},x^{(2)},\cdots, x^{(n)})^T \in \mathbf{R}^n$ ， $\alpha_i\geq 0,\beta_j$ 是拉格朗日乘子。考虑 $x$ 的函数：
$\theta_P(x)=\max_{\alpha,\beta;\alpha_i\geq 0}L(x,\alpha,\beta)$
下标P表示原始问题。

假设给定某个 $x$ ，如果 $x$ 违反原始问题的约束条件，即存在某个 $i$ 使得 $c_i(w)>0$ 或者存在某个 $j$ 使得 $h_j(w)\neq 0$ ，则有
$\theta_P(x)=\max_{\alpha,\beta;\alpha_i\geq 0}\left[f(x)+\sum_{i=1}^k \alpha_ic_i(x)+\sum_{j=1}^l \beta_jh_j(x)\right]=+\infty$
因为某个 $i$ 使得约束 $c_i(x)>0$ ，故我令 $\alpha_i\rightarrow +\infty$ ，则可得到上式；同理，若某个 $j$ 使得约束 $h_j(x)\neq 0$ ，则令 $\beta_jh_j(x)\rightarrow +\infty$ ，也可得到上式。
相反地，如果约束条件均满足，则 $\theta_P(x)=f(x)$ ，因此
$\theta_P(x)=\begin{cases}f(x ), & x 满足原始问题约束\\+\infty, & 其他\end{cases}$
所以考虑极小化问题
$\min_x \theta_P(x)=\min_x\max_{\alpha,\beta; \alpha_i\geq 0}L(x,\alpha,\beta)$
它与原始问题是等价的，即具有相同的解，我们把问题 $\min\limits_x\max\limits_{\alpha,\beta; \alpha_i\geq 0}L(x,\alpha,\beta)$ 称为广义拉格朗日函数的极小极大问题，这样以来就将原始问题转化为广义拉格朗日函数的极小极大问题。
对偶问题
定义
$\theta_D(\alpha,\beta)=\min_x L(x,\alpha,\beta)$

再考虑极大化 $\theta_D(\alpha,\beta)$
$\max_{\alpha,\beta;\alpha_i\geq0}\theta_D(\alpha,\beta)=\max_{\alpha,\beta;\alpha_i\geq0}\min_x L(x,\alpha,\beta)$

该问题称为广义拉格朗日问题的极大极小问题。

可以将广义拉格朗日的极大极小问题表示为约束最优化问题：
$\begin{aligned}\max_{\alpha,\beta}\theta_D(\alpha,\beta)=&\max_{\alpha,\beta}\min_x L(x,\alpha,\beta)\\ s.t. \quad &\alpha_i\geq 0,i=1,2,\cdots, k\end{aligned}$

称为原始问题的对偶问题。

原始问题与对偶问题的关系

Theorem1. 若原始问题和对偶问题都有最优值，则
$d^*=\max_{\alpha,\beta;\alpha_i\geq0}\min_x L(x,\alpha,\beta)\leq \min_x\max_{\alpha,\beta;\alpha_i\geq 0} L(x,\alpha,\beta)=p^*$

Proof.
$\theta_D (\alpha,\beta)=\min_x L(x,\alpha,\beta)\leq L(x,\alpha,\beta)\leq \max_{\alpha,\beta;\alpha_i\geq 0} L(x,\alpha,\beta)=\theta_P(x)$

则
$\theta_D(\alpha,\beta)\leq \theta_P(x)$
由于原始问题和对偶问题均有最优值，则
$\max_{\alpha,\beta;\alpha_i\geq 0} \theta_D(\alpha,\beta)\leq \min_x \theta_P(x)$

故 $d^*\leq p^*$
换句话说，对偶问题的最优值小于等于原问题的最优值。

Corollary 1. 设 $x^*$ 和 $\alpha^*$ ， $\beta^*$ 分别表示原始问题和对偶问题的可行解，并且 $d^*=p^*$ ，则 $x^*$ 和 $\alpha^*$ ， $\beta^*$ 分别是原始问题和对偶问题的最优解。

在这种条件下，原始问题和对偶问题的最优值相等，这时可以用解对偶问题代替解原始问题。

Theorem 2. 考虑原始问题和对偶问题。假设函数 $f (x)$ 和 $c_i(x)$ 是凸函数， $h_j(x)$ 是仿射函数；假设不等式约束 $c_i(x)$ 是严格可行的，即存在 $x$ ，对所有的 $i$ 有 $c_i(x)<0$ ，则存在 $x^*,\alpha^*,\beta^*$ ，使得 $x^*$ 是原始问题的解， $\alpha^*,\beta^*$ 是对偶问题的解，并且
$p^*=d^*=L(x^*,\alpha^*,\beta^*)$

Theorem 3. 对原始问题和对偶问题，假设函数 $f (x)$ 和 $c_i(x)$ 是凸函数， $h_j(x)$ 是仿射函数，并且不等式约束 $c_i(x)$ 是严格可行的，则 $x^*$ 和 $\alpha^*,\beta^*$ 分别是原始问题和对偶问题的解的充分必要条件是 $x^*,\alpha^*,\beta^*$ 满足Karush-kuhn-Tucker(KKT)条件：
$\begin{aligned}\nabla_x L(x^*,\alpha^*,\beta^*)=0\\ \nabla_\alpha L(x^*,\alpha^*,\beta^*)=0\\ \nabla_\beta L(x^*,\alpha^*,\beta^*)=0\\ \alpha^*_ic_i(x^*)=0, i=1,2,\cdots, k\\ c_i(x^*)\leq 0, i=1,2,\cdots, k\\ \alpha_i^*\geq 0,i=1,2,\cdots,k\\ h_i(x^*)=0 \end{aligned}$