对偶的应用及拓展（Duality Uses and Correspondences）

最新推荐文章于 2023-04-02 15:56:08 发布

JimmyCM

最新推荐文章于 2023-04-02 15:56:08 发布

阅读量1.2k

点赞数

分类专栏：凸优化及其应用数学理论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zbwgycm/article/details/115335354

版权

数学理论同时被 2 个专栏收录

13 篇文章 25 订阅

订阅专栏

凸优化及其应用

11 篇文章 38 订阅

订阅专栏

总目录

一、凸优化基础（Convex Optimization basics）

凸优化基础（Convex Optimization basics）

二、一阶梯度方法（First-order methods）

三、对偶

Introduction

在前几节中我们讨论了对偶。在强对偶条件下，给定对偶问题的最优解 $u^*,v^*$ ，任何使得拉普拉斯方程 $L(x,u^*,v^*)$ 最小化的 $x$ 都是原问题的最优解。特别是当原问题的解唯一时，其一定是最优解 $x^*$ 。这使得我们可以借助于对偶来求解原问题的解。本节我们主要讨论跟对偶相关的一些知识及应用。

对偶范数

令 $\|x\|$ 为一个范数（norm），定义其对偶范数（dual norm） $x\|_*$ 为
$\|x\|_*=\max_{\|z\|\leq1}z^Tx$

那么根据对偶关系可以得到 $\|z^Tx\|\leq\|z\|\|x\|_*$ 。
例如，

$\mathcal{l}_p$ norm: $\|x\|_p=(\sum^m_{i=1}|x_i|^p)^{1/p}$ , for $p\geq1$
Trace norm: $\|X\|_{tr}=\sum^r_{i=1}\sigma_i(X)$ (迹范数定义为矩阵所有特征值之和)

则其对应的对偶范数为

$\mathcal{l}_p$ norm dual: $x\|_p)_*=\|x\|_q$ ，其中， $1 / p + 1 / q = 1$
Trace norm dual: $(\|X\|_{tr})_*=\|X\|_{op}=\sigma_1(X)$ 即矩阵最大的特征值

在强对偶下，对偶范数的对偶范数为其本身，即 $x\|_{**}=\|x\|$ 。

共轭函数

共轭函数的定义

给定一个函数 $R^n \to R$ ，定义其共轭(conjugate)为 $f^*: R^n\to R$ ，
$f^*(y)=\max_x y^Tx-f(x)$

注意到 $f^*$ 总是凸函数，因为其是凸函数（仿射函数）的最大值。如下图所示， $f^*(y)$ 表示最大化线性函数 $y^Tx$ 与函数 $f (x)$ 的间隔。
在这里插入图片描述
对于可微函数 $f$ ，共轭也被叫做勒让德变换（Legendre transform）。

共轭函数的性质

Fenchel不等式：对于任意 $x, y$ ，
$f(x)+f^*(y)\geq x^Ty$
共轭的共轭 $f^{**}$ 满足 $f^{**}\leq f$ 。
如果 $f$ 是闭合的且是凸的，那么 $f^{**}=f$
如果 $f$ 是闭合的且是凸的，那么对于任意 $x, y$ ，
$x\in\partial f^*(y) \Longleftrightarrow y\in\partial f(x) \Longleftrightarrow f(x)+f^*(y)=x^Ty$
如果 $f(u,v)=f_1(u)+f_2(v)$ ，那么
$f^*(w,z)=f^*_1(w)+f^*_2(z)$

例子：

二次规划： $f(x)=\frac{1}{2}x^TQx$ ，其中 $Q\succ0$ 。那么 $y^Tx-\frac{1}{2}x^TQx$ 是严格凹的，其最大值在 $y=Q^{-1}x$ 处取得，因此
$f^*(y)=\frac{1}{2}y^TQ^{-1}y$
指示函数：如果 $f(x)=I_C(x)$ ，那么其共轭为
$f^*(y)=I^*_c(x)=\max_{x\in C}y^Tx$ 也被称为集合 $C$ 的支持函数（support function）。
范数：如果 $f(x)=\|x\|$ ，那么其共轭为
$f^*(y)=I_{\{z:\|z\|_*\leq 1\}}(y)$ 其中 $\|\cdot\|_*$ 是 $\|\cdot\|$ 的对偶范数

共轭与对偶问题

共轭常出现在对偶问题的推导中。在最小化拉格朗日函数过程中，以
$f^*(u)=\min_x f(x)-u^Tx$ 形式出现。

如考虑优化问题
$min_x f(x)+g(x)$

其等价于
$\begin{aligned} \min_{x,z}f(x)+g(z)\\ subject\ to\quad x=z\\ \end{aligned}$

拉格朗日对偶函数为
$\begin{aligned} g(u)=&\min_{x,z} f(x)+g(z)+u^T(z-x)\\ &=\min_{x,z}f(x)-u^Tx+g(z)-(-u)^Tz\\ &=-\max_x\{u^Tx-f(x)\}-\max_z\{(-u)^Tz-g(z)\}\\ &=-f^*(u)-g^*(-u) \end{aligned}$

因而对偶问题为
$max_u -f^*(u)-g^*(-u)$

转移线性变换

对偶公式可以帮助我们在目标函数的不同部分之间转移线性变换（shifting linear transformations）。
考虑以下问题
$min_x f(x)+g(Ax)$

其等价于
$\begin{aligned} \min_{x,z}f(x)+g(z)\\ subject\ to\quad Ax=z\\ \end{aligned}$
像前面一样，其对偶问题为
$max_u -f^*(A^Tu)-g^*(-u)$

对偶的技巧

常常我们把对偶转换为一个等价的问题，仍然称为对偶。在强对偶条件下，我们可以使用对偶问题（或经过变换的对偶问题）的解来求解原问题的解。

为了得到无约束问题的对偶形式，一般首先在原问题中加入一个虚拟的中间变量，从而引入等式约束。再通过拉格朗日方程得到对偶形式。通常这种变换并不是唯一的，不同的变换可能导致不同的对偶问题。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
对偶的应用及拓展（Duality Uses and Correspondences）

Introduction在前几节中我们讨论了对偶。在强对偶条件下，给定对偶问题的最优解u∗,v∗u^*,v^*u∗,v∗，任何使得拉普拉斯方程L(x,u∗,v∗)L(x,u^*,v^*)L(x,u∗,v∗)最小化的xxx都是原问题的最优解。特别是当原问题的解唯一时，其一定是最优解x∗x^*x∗。这使得我们可以借助于对偶来求解原问题的解。本节我们主要讨论跟对偶相关的一些知识及应用。对偶范数令∥x∥\|x\|∥x∥为一个范数（norm），定义其对偶范数（dual norm）∥x∥∗\|x\|_*∥x∥∗
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。