对偶上升法 (Dual Ascent)

最新推荐文章于 2024-11-02 17:32:31 发布

B417科研笔记

最新推荐文章于 2024-11-02 17:32:31 发布

阅读量5.8k

点赞数 14

分类专栏：通信中的常用数学

本文链接：https://blog.csdn.net/weixin_39274659/article/details/119491997

版权

通信中的常用数学专栏收录该内容

48 篇文章

订阅专栏

对偶上升法

对于一个等式约束的凸优化问题如下：
$\begin{array}{ll} \operatorname{minimize} & f(x) \\ \text { subject to } & A x=b, \end{array}$
其中， $f (x)$ 为凸函数。
对偶上升法是一种行之有效的方法。首先，我们将限制条件通过拉格朗日乘子写入目标中，得到拉格朗日函数为：
$L(x, y)=f(x)+y^{T}(A x-b)$

那么，其对偶函数为：
$g(y)=\inf _{x} L(x, y)$
相应的对偶问题为：
$\text { maximize } g(y) \tag{1}$
若强对偶性成立，则最优解 $x^\star$ 由下式给出：
$x^{\star}=\underset{x}{\operatorname{argmin}} L\left(x, y^{\star}\right), \tag{2}$
其中 $y^\star$ 为(1)的最优解。
接下来，我们考虑如何求解单变量对偶问题(1)，因为有了(1)的解我们就可以由(2)得到原问题的最优解。

而对偶上升法的算法流程如下：

$\begin{aligned} &x^{k+1}:=\underset{x}{\operatorname{argmin}} L\left(x, y^{k}\right) \\ &y^{k+1}:=y^{k}+\alpha^{k}\left(A x^{k+1}-b\right), \end{aligned}$

流程很简单，也就是说，我们可以通过一种梯度法的方式迭代求解 $y$ 。但是，为什么可以这样呢？

对偶上升法的原理

其实对偶上升法的思路就如一开始所说，寻找一个 $y$ 最大化 $g (y)$ ，那么给定初始点 $y_0$ 时，一种常见的做法就是梯度下降法（这里对应的是梯度上升法），即求取 $\nabla g(y_0)$ , 将 $y_1$ 更新为 $y_0 + \alpha\nabla g(y_0)$ 。

就着这个思路，我们事实上就是要求取 $\nabla g(y)$ 。注意到，无论 $f (x)$ 是否凸，对偶函数 $g (y)$ 一定是凹函数（一族仿射函数的逐点下确界）。因此，根据凹函数的一阶条件，我们有：
$\leq g(y)+ \nabla g(y)^T(z-y) \quad \forall z \tag{3}$

注意到，根据 $g$ 的定义， $g (z)$ 可写为：
$g(z) =\inf_x(f(x)+z^{T}(A x-b)) =\inf_x(f(x)+y^{T}(A x-b)+(z-y)^{T}(A x-b))$
令 $x^{+} \in \operatorname{argmin} L(x, y)$ , 我们有：
$\inf_x(f(x)+y^{T}(A x-b)+(z-y)^{T}(A x-b)) \le (f(x^+)+y^{T}(A x^+-b)+(z-y)^{T}(A x^+-b))\\=g(y) + (A x^+-b)^T(z-y) \tag{4}$