凸优化学习-（二十）从四个角度理解原问题最优解和对偶问题最优解的关系

最新推荐文章于 2023-11-05 16:38:11 发布

明远湖边的秃头

最新推荐文章于 2023-11-05 16:38:11 发布

阅读量7.6k

点赞数 1

分类专栏： # 凸优化文章标签：深度学习

本文链接：https://blog.csdn.net/qq_40917612/article/details/105093322

版权

凸优化专栏收录该内容

30 篇文章 119 订阅

订阅专栏

凸优化学习

本节探究 $p^*=d^*$ 时的不同角度理解。

学习笔记

一、几何理解

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ \qquad\text{s.t.}&&f_1(x)&\le0\\ \end{aligned}\\$
做如下定义：
$G=\lbrace(f_1(x),f_0(x)\mid x\in D\rbrace$
可以推出：
$p^*=\inf\lbrace t\mid(u,t)\in G,u\le0\rbrace\\ g(\lambda)=\inf\lbrace\lambda\cdot u+t\mid(u,t)\in G\rbrace\ \$
先上结论：
在这里插入图片描述

图1

图1是弱对偶的情况。

在这里插入图片描述

图2

在这里插入图片描述

图3

图2和图3是强对偶的情况。
这个几何解释的思路有些绕，但是很巧妙，我会尽量用简单的语句解释。

首先，我们定义一个坐标轴，它的横轴是 $u$ ，也就是 $f_1(x)$ ，纵轴是 $t$ 也就是 $f_0(x)$ 。那么 $p^*=\inf\lbrace t\mid(u,t)\in G,u\le0\rbrace$ 就很好理解了，即在 $f_1(x)\le0$ 的情况下求 $f_0(x)$ 的最小值，显然和原问题等价。同理， $g(\lambda)=\inf\lbrace\lambda\cdot u+t\mid(u,t)\in G\rbrace$ 的定义也很好理解。
在这个 $t - u$ 坐标轴中，我们考虑 $g(\lambda)$ 要求下确界的这么一条直线 $l:\lambda u+t=b$ ,其中很显然， $-\lambda$ 是 $l$ 的斜率， $b$ 是截距。我们首先要最小化这个截距，但是 $l$ 是只能在 $G$ 里面动的，所以 $b$ 的下降，最终一定是切在 $G$ 上的（图1中由不可行到可行，讲课的时候老师绕了一下，本质上是一样的）。求出 $g(\lambda)$ 后，我们就可以求 $d^*$ 了，那么此时 $\max g(\lambda)$ 是一个改变斜率的过程，改成同时切 $G$ 的两个点，得到的 $b$ 就是 $d^*$ 。
由图1可以看到， $p^*\ge d^*$ 。

二、鞍点理解

若存在先从 $x$ 方向求极小再向 $y$ 方向求极大得到的点与先从 $y$ 方向求极大再向 $x$ 方向求极小得到的点是同一个点，则称其为鞍点。
对于一个优化问题，通常有：
$d^*=\sup_{\lambda\ge0}\inf_{x\in D}l(x,\lambda)\\ p^*=\inf_{x\in D}\sup_{\lambda\ge0}l(x,\lambda)$
$d^*$ 很好理解，它的定义就是这样的，我们来看看 $p^*$ :
$\begin{aligned} p^*&=\inf_{x\in D}\sup_{\lambda\ge0}l(x,\lambda)\\ &=\inf_{x\in D}\sup_{\lambda\ge0}f_0(x)+\sum_{i=1}^n\lambda_i f_i(x)\\ &=\inf_{x\in D}\begin{cases} f_0(x)&\forall i\ \ f_i(x)\le0\\ +\infty&\exist i\ \ f_i(x)>0 \end{cases}\\ &=\inf_{x\in D}f_0(x)\qquad\forall i\ \ f_i(x)\le0\\ \end{aligned}$
显然和原问题等价。

我们来分析 $p^*$ 和 $d^*$ 。一般情况下，我们都有：
$\sup_{\lambda\ge0}\inf_{x\in D}l(x,\lambda)\le\inf_{x\in D}\sup_{\lambda\ge0}l(x,\lambda)$
这是一个鸡头和凤尾的比较，很好理解，故，在没有鞍点的情况下：
$d^*\le p^*$
但，若对于 $l$ ，其是个有鞍点的函数，那么此时 $p^*=d^*$ 。
此时拉格朗日函数可能会长成这样：
在这里插入图片描述
那么，我们称 $(x^*,\lambda^*)$ 为鞍点。

三、多目标优化角度理解

多目标优化：

$\begin{aligned} \min&&\lbrace f_{0}(x),\cdots f_m(x)\rbrace&\\ \end{aligned}\\$
单目标优化：
$\begin{aligned} \min&&f_{0}(x)\\ \text{s.t.}&& f_i(x)&\le0\qquad i=1,\cdots,m\\ \end{aligned}\\$
在之前的学习中，我们学到多目标优化可以转换为：
$\begin{aligned} \min&&\sum_{i=0}^m\lambda_if_{i}(x)&\\ \end{aligned}\\$
我们取一个特殊的权：
$\begin{aligned} \min&&f_0(x)+\sum_{i=1}^m\lambda_if_{i}(x)& \end{aligned}\\$
这不就是单目标优化中的 $g$ 吗？即多目标优化等价于求单目标优化的 $g$ 。
当这个单目标优化问题是由多目标优化问题转化而来，记单目标优化问题为1，多目标优化问题为2，有：
$\begin{aligned} p_2^*&=g_1(\lambda)\\ \end{aligned}$
当单目标优化中 $d^*=p^*$ 时，可以认为单目标优化的最优解等价于多目标优化的一个最优解，因为单目标优化还要求一个 $\max$ ，而多目标优化只求到 $\min$ 。

四、经济学角度理解

设有一工厂， $x$ 为生产商品的数量， $f_0(x)$ 为工厂的损失， $f_i(x)$ 为原材料的约束，有就为负。当原材料不可交易时：
$\begin{aligned} \min&& f_0(x)&\\ (\text P)\qquad\text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ \end{aligned}\\$

当原材料可交易时， $\lambda_i\ge0$ 为交易价格：
$\begin{aligned} \max&& g(\lambda)&\\ (\text D)\qquad\text{s.t.}&&\lambda\ \ge0&\\ \end{aligned}\\$
一个是计划经济，一个是市场经济，从常识角度考虑，一般都有：
$d^*\le p^*$ ：表示当原材料可交易时，你的最大损失小于等于原材料不可交易时的最小损失。
$d^*= p^*$ ：表示原材料刚好用完或原材料价格为零。