基追问题（basis pursuit problem）

m0_58786865

已于 2024-01-11 17:58:54 修改

阅读量866

点赞数 17

分类专栏：求解变分不等式 matlab 凸优化文章标签：算法

于 2024-01-07 20:06:24 首次发布

本文链接：https://blog.csdn.net/m0_58786865/article/details/135443311

版权

求解变分不等式同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

凸优化

3 篇文章 0 订阅

订阅专栏

matlab

2 篇文章 0 订阅

订阅专栏

基追问题

介绍
处理
AD-LPMM
GEM
PGA
- $PGA_{a1}$
- $PGA_{b1}$

介绍

basis pursuit problem
$\quad\theta(x)$
$s.t.\quad Ax=b$
其中 $A\in R^{m\times n},c \in R^m,\theta:R^n\rightarrow(-\infty,\infty]$ 为闭正常凸函数

处理

考虑基追问题拉格朗日函数
$L(x,\lambda)=\theta(x)-\lambda^T(Ax-b).$
则 $(x^*,\lambda^*)\in R^n\times R^m$ 是基追问题的鞍点当且仅当
$\mathop{min}\limits_{\lambda}L(x^*,y^*,\lambda)\le L(x^*,y^*,\lambda^*)\le \mathop{min}\limits_{x,y}L(x,y,\lambda^*),$
相当于
$\theta(x，\lambda)-\theta_1(x^*，\lambda^*)+ \begin{bmatrix} x-x^*\\\lambda-\lambda^* \end{bmatrix}^T \begin{bmatrix} \begin{pmatrix} 0&-A^T\\ A&0 \end{pmatrix} \begin{pmatrix} x^*\\\lambda^* \end{pmatrix}+ \begin{pmatrix} 0\\-b \end{pmatrix} \end{bmatrix}\ge 0.$
即 $\theta(x,\lambda)=\|x\|_1$ 和 $F(x,\lambda)=\begin{bmatrix}0&-A^T\\A&0\end{bmatrix}\begin{bmatrix}x\\\lambda\end{bmatrix}+ \begin{bmatrix}0 \\-b\end{bmatrix}$

转化为变分不等式求解问题
$\theta(x) -\theta(x^*) +(x- x^*)^T F(x^*) \ge 0$

AD-LPMM

$y = A x - b$
$L(x,y,\lambda,\rho)=\theta(x)-\lambda^T(y-b)+\frac{\rho}{2}\|y\|^2\\ \quad\quad\quad=\theta(x)+\frac{\rho}{2}\|y-\frac{\lambda^T}{\rho}\|^2+c$
c为常数
$Prox_f:x\rightarrow\arg\min\{f(y)+\frac{1}{2}\|x-y\|^2:y\in R^n\}$
$\arg\min L(x,y,\lambda,\rho)=\arg\min\{\frac{\theta(x)}{\rho}+\frac{1}{2}\|(x+y-\frac{\lambda^T}{\rho})-x\|^2\}=Prox_{\frac{\theta}{\rho}}[x+y-\frac{\lambda^T}{\rho}].$

初始化: $x^0 \in R^n$ ， $\lambda^0 \in R^m$ ， $\rho>0$ ， $\lambda_{max}(A^TA)\le1.$
一般步骤:对 $k = 0, 1,$ …执行以下步骤:
$(a)x^{k+1}=Prox_{\frac{\theta}{\alpha}}[x^k+\frac{\alpha}{\rho}A^T(y^k-\frac{\lambda^T}{\rho})];$
$(b)y^{k+1}=Prox_{\frac{\theta}{\beta}}[y^k+\frac{\beta}{\rho}(Ax^{k+1}-\frac{\lambda^T}{\rho})];$
$(c)\lambda^{k+1}=\lambda^k+\rho(Ax^{k+1}-b-y^{k+1}).$

GEM

初始化: $x^0 \in R^n$ ， $\lambda^0 \in R^m$ ， $\beta>0$ ，并且 $\nu,\mu\in(0,1)$ ， $\mu<\nu，\beta$ 采取自适应规则
$(1)\widetilde{x}^k=Prox_{\beta\theta_1}(x^k+\beta A^T\lambda^k);$
$(2)\widetilde{\lambda}^k=\lambda^k-\beta(Ax^k-b);$
$(3)r_k=\beta\begin{Vmatrix}\begin{pmatrix}A^T(\lambda^k-\widetilde{\lambda}^k)\\A(x^k-\widetilde{x}^k)\end{pmatrix}\end{Vmatrix}\bigg/ \begin{Vmatrix}\begin{pmatrix}x^k-\widetilde{x}^k\\\lambda^k-\widetilde{\lambda}^k\end{pmatrix}\end{Vmatrix};$
$(4)$ 如果 $r_k>\nu$ ：
$(5)\quad\quad\beta=\frac{2}{3}*\beta\min\{1,\frac{1}{r_k}\};$
$(6)\quad\quad$ 跳转到 $(1)$ .
$(7)x^{k+1}=Prox_{\beta\theta_1}(x^k+\beta A^T\widetilde{\lambda}^k);$
$(8)\lambda^{k+1}=\lambda^k-\beta(A\widetilde{x}^k-b);$
$(9)$ 如果 $r_k\le\nu$ ：
$(10)\quad\quad\beta=1.5*\beta;$

PGA

$PGA_{a1}$

初始化: $x^0 \in R^n，\lambda^0 \in R^m,\beta>0，\nu,\mu\in(0,1)，\gamma\in(0,2).$
$(1)$ $\widetilde{x}^k=Prox_{\beta\theta_1}(x^k+\beta A^T\lambda^k);$
$(2)$ $\widetilde{\lambda}^k=\lambda^k-\beta(Ax^k-b);$
$(3)$ $r_k=\beta\begin{Vmatrix}\begin{pmatrix}A^T(\lambda^k-\widetilde{\lambda}^k)\\A(x^k-\widetilde{x}^k)\end{pmatrix}\end{Vmatrix}\bigg/ \begin{Vmatrix}\begin{pmatrix}x^k-\widetilde{x}^k\\\lambda^k-\widetilde{\lambda}^k\end{pmatrix}\end{Vmatrix};$
$(4)$ 如果 $r_k>\nu$ ：
$(5)\quad\quad\beta=\frac{2}{3}*\beta\min\{1,\frac{1}{r_k}\};$
$(6)\quad\quad$ 跳转到 $(1)$ .
$(7)\alpha^*_k=\begin{Vmatrix}\begin{pmatrix}x^k-\widetilde{x}^k\\\lambda^k-\widetilde{\lambda}^k\end{pmatrix}\end{Vmatrix}^2\bigg/\begin{Vmatrix}\begin{pmatrix}[x^k-\widetilde{x}^k]+\beta[A^T(\lambda^k-\widetilde{\lambda}^k)]\\ [\lambda^k-\widetilde{\lambda}^k]-\beta[A(x^k-\widetilde{x}^k)]\end{pmatrix}\end{Vmatrix}^2;$
$(6)x^{k+1}=x^k-\gamma\alpha^*_k([x^k-\widetilde{x}^k]+\beta[A^T(\lambda^k-\widetilde{\lambda}^k)]);$
$(7)\lambda^{k+1}=\lambda^k-\gamma\alpha^*_k([\lambda^k-\widetilde{\lambda}^k]-\beta[A(x^k-\widetilde{x}^k))]);$
$(8)$ 如果 $r_k\le\nu$ :
$(9)\quad\quad\beta=1.5*\beta$

$PGA_{b1}$

除（3）外，其他步骤与 $PGA_{a1}$ 相同
$(3)\alpha^*_k=\frac{\begin{bmatrix}x^k-\widetilde{x}^k\\\lambda^k-\widetilde{\lambda}^k\end{bmatrix}^T\begin{bmatrix}x^k-\widetilde{x}^k+\beta A^T(\lambda^k-\widetilde{\lambda}^k)\\\lambda^k-\widetilde{\lambda}^k-\beta A(x^k-\widetilde{x}^k)\end{bmatrix}}{\begin{Vmatrix}\begin{pmatrix}x^k-\widetilde{x}^k+\beta A^T(\lambda^k-\widetilde{\lambda}^k)\\ \lambda^k-\widetilde{\lambda}^k-\beta A(x^k-\widetilde{x}^k)\end{pmatrix}\end{Vmatrix}^2};$