凸优化学习-（十九）深入分析对偶问题

最新推荐文章于 2024-05-18 13:07:18 发布

明远湖边的秃头

最新推荐文章于 2024-05-18 13:07:18 发布

阅读量842

点赞数 3

分类专栏： # 凸优化文章标签：深度学习

本文链接：https://blog.csdn.net/qq_40917612/article/details/105048005

版权

凸优化专栏收录该内容

30 篇文章 132 订阅

订阅专栏

凸优化学习

学习笔记

一、原问题最优值 $\text p^$ 与与对偶问题最优值 $\text d^$ 分析

1、背景知识

对于一个普通优化问题：
$\begin{aligned} \min&& f_0(x)&\\ (\text P)\qquad\text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$
拉格朗日函数( $\text{lagrangian function}$ )：
$l(x,\lambda,v)=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^pv_ih_i(x)$
由拉格朗日函数构造的对偶函数( $\text{dual function}$ )：
$g(\lambda,v)=\inf_{x\in D}l(x,\lambda,v)$
其对偶问题为：
$\begin{aligned} \max&& g(\lambda,v)&\\ (\text D)\qquad\text{s.t.}&&\lambda\ \ge0&\\ \end{aligned}\\$

结论：

对偶问题是凸优化问题。
$\text d^*\le\text p^*$

定义：

$\text p^*$ ：原问题最优值。 $\text d^*$ ：对偶问题最优值。
弱对偶 $\text{Weak Duality}$ ： $\text d^*\le\text p^*$ 时。任何优化问题都是弱对偶。
强对偶 $\text{Strong Duality}$ ： $\text d^*=\text p^*$ 时。凸问题一般是强对偶。
$\text p^*-\text d^*$ ：对偶间隙 $\text{Duality gap}$ 。
相对内部 $\text{Relative Interior}$ 。
形如：
$\text{Relint}D=\lbrace x\in D\mid B(x,r)\cap\text{aff}D\in D\quad\exist r\in D$
其中， $B (x, r)$ 是以 $x$ 为中心， $r$ 为半径的球。 $\text{aff}D$ 指 $D$ 的仿射包。

相当于将集合的边缘去掉，使之成为一个开集。

2、 $\text d^=\text p^$ 的条件

$\text{Slater's Condition}$ （充分而不必要）：
若有凸问题：
$\begin{aligned} \min&& f_0(x)&\\ \text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\$
当 $\exist x\in \text{relint}D$ 使 $f_i(x)<0,i=1\cdots m,h_i(x)=0,i=1\cdots p$ 满足时， $\text d^*=\text p^*$ 。

一般我们见到的凸问题都是满足的，有一些人为构造的凸问题不满足。
当然这个可能还是有些难以满足，所以又有如下一个较弱的条件：
$\text{A Weaker Slater's Condition}$
若不等式约束为仿射时，只要可行域非空，必有 $\text d^*=\text p^*$ 。

线性规划若可行，必有 $\text d^*=\text p^*$ 。
例1： QCQP问题
$\begin{aligned} \min&&\frac 1 2x^T\textbf{P}_{\textbf 0}x+q^T_0x+r_0&\\ (\text P)\qquad\text{s.t.}&&\frac 1 2 x^Tp_ix+q_ix+r_i&\le0\qquad i=1\cdots m\\ && \textbf{P}_{\textbf 0}\in\textbf{S}_{\textbf {++}}^n,p_i\in\textbf{S}_{\textbf +}^n \end{aligned}\\$
拉格朗日函数( $\text{lagrangian function}$ )：
$\begin{aligned} l(x,\lambda)&=\frac 1 2x^T\textbf{P}_{\textbf 0}x+q^T_0x+r_0+\sum_{i=1}^m\lambda_i(\frac 1 2 x^Tp_ix+q_ix+r_i)\\ &=\frac 1 2x(p_0+\sum_{i=1}^m\lambda_ip_i)x+(q_0+\sum_{i=1}^m\lambda_iq_i)^Tx+r_0+\sum_{i=1}^m\lambda_ir_i \end{aligned}$
对偶函数( $\text{dual function}$ )：
$\begin{aligned} g(\lambda)&=\inf_{x\in D}l(x,\lambda)\\ &=-\frac 1 2q^T(\lambda)p^{-1}(\lambda)q(\lambda)+r(\lambda) \end{aligned}$
其对偶问题为：
$\begin{aligned} \max&&-\frac 1 2q^T(\lambda)p^{-1}(\lambda)q(\lambda)+r(\lambda) \\ (\text D)\qquad\text{s.t.}&&\lambda\ \ge0\\ \end{aligned}\\$
显然 $\text d^*=\text p^*$ ，此时我们验证一下 $\text{Slater's Condition}$ ：
对于约束 $\frac 1 2 x^Tp_ix+q_ix+r_i\le0\qquad i=1\cdots m$ 当 $q_i=0,r_i=0$ 时，怎么样都不满足此约束。
故QCQP问题是一个不满足 $\text{Slater's Condition}$ 但 $\text d^*=\text p^*$ 的问题。