约束优化问题--乘子法

最新推荐文章于 2024-09-29 23:16:27 发布

Daytoy Studio

最新推荐文章于 2024-09-29 23:16:27 发布

阅读量508

点赞数 2

分类专栏：优化方法文章标签： matlab 算法

本文链接：https://blog.csdn.net/yixon_oss/article/details/131583984

版权

优化方法专栏收录该内容

3 篇文章 1 订阅

订阅专栏

文章详细介绍了乘子法在处理约束优化问题中的应用，包括惩罚函数法的局限性，Hestenes乘子法和Rockafellar乘子法的原理。Hestenes乘子法通过结合Lagrange函数和惩罚项来处理等式约束，而Rockafellar乘子法扩展到处理不等式约束。文章提供了两种方法的迭代过程和终止条件，并通过实例展示了乘子法的运用。

摘要由CSDN通过智能技术生成

乘子法

惩罚函数法再分析

主要缺点: 当惩罚因子 $M$ 增大, 无约束问题的目标函数 $F(\boldsymbol{x},M)$ 的Hesse矩阵越来越病态, 使得无约束优化方法的计算难以进行. 下面分析 $M$ 必须无限增大的原因.

考虑等式约束优化问题
$\begin{align*} & \min f(\boldsymbol{x})\\ & s.t. h_i(\boldsymbol{x})=0,i=1,2,...,p. \end{align*}$
引入罚函数
$F(\boldsymbol{x},M)=f(\boldsymbol{x})+\sum_{i=1}^p[h_i(\boldsymbol{x})]^2,$
若 $\boldsymbol{x}^*$ 是问题的最优解, 则 $h_i(\boldsymbol{x}^*)=0,i=1,2,...,p$ . 于是有
$\nabla_xF(\boldsymbol{x}^*,M)=\nabla f(\boldsymbol{x}^*)+2M\sum_{i=1}^ph_i(\boldsymbol{x}^*)\nabla h_i(\boldsymbol{x}^*)=\nabla f(\boldsymbol{x}^*).$
另一方面, 考虑上述约束问题的 $L a g r an g e$ 函数
$L(\boldsymbol{x},\mu)=f(\boldsymbol{x})+\sum_{i=1}^p\mu_ih_i(\boldsymbol{x}),$
由KKT条件有
$\nabla_xL(\boldsymbol{x}^*,\mu^*)=\nabla f(\boldsymbol{x}^*)+\sum_{i=1}^p \mu_i\nabla h_i(\boldsymbol{x}^*)=0.$
则可知在通常情况下, $\nabla f(\boldsymbol{x}^*)\ne 0$ . 只有当 $\boldsymbol{x}^*$ 是 $f(\boldsymbol{x})$ 无约束问题稳定点时, $\nabla f(\boldsymbol{x}^*)= 0$ 才成立. 因此, 找不到一个有限的 $M$ , 使得 $\nabla_xF(\boldsymbol{x}^*,M)=0$ 成立, 只能期望 $\lim_{M\rightarrow+\infty}\nabla_xF(\boldsymbol{x}^*,M)=0$ .

以上分析过程启发我们将 $L a g r an g e$ 函数与惩罚项相结合, 构造增广 $L a g r an g e$ 函数, 也就是接下来要介绍的乘子法.

Hestenes乘子法

Hestenes首先引入增广 $L a g r an g e$ 函数
$\begin{align*} \varphi(\boldsymbol x,\boldsymbol{\mu})& =f(\boldsymbol x)+\sum_{i=1}^p\mu_ih_i(x)+\frac{c}{2}\sum_{i=1}^p[h_i(x)]^2\\ & =:L(\boldsymbol x,\boldsymbol \mu)+\frac{c}{2}\sum_{i=1}^p[h_i(x)]^2. \end{align*}$
其中 $\boldsymbol \mu=[\mu_1,...,\mu_p]$ 为 $L a g r an g e$ 乘子, 罚因子被改写为 $\frac{c}{2}$ .

由最优性一阶必要条件可知, $\exists \boldsymbol \mu^*,s.t. (\boldsymbol x^*,\boldsymbol \mu^*)$ 为 $L(\boldsymbol x,\boldsymbol \mu)$ 的稳定点, 即 $\nabla_xL(\boldsymbol x^*,\boldsymbol \mu^*)=0$ . 又因为附加项 $\frac{c}{2}\sum_{i=1}^p[h_i(x)]^2$ 在 $x^*$ 梯度为0, 因此有
$\nabla_x\varphi(\boldsymbol x^*,\boldsymbol \mu^*)=0.$
说明 $x^*$ 是 $\varphi(\boldsymbol x^*,\boldsymbol \mu^*)$ 稳定点. 则问题进一步转化为, 对某个 $\boldsymbol \mu^*$ , 求 $\varphi(\boldsymbol x^*,\boldsymbol \mu^*)$ 的无约束极小点.

求解思路: 首先给定一个足够大的正数 $c$ , 在迭代过程中逐步调整 $\boldsymbol \mu^{(k)}$ .

假设已经求得 $\boldsymbol \mu^{(k)}$ , 求解 $\min\varphi(\boldsymbol x,\boldsymbol \mu^{(k)})$ 得最优解 $\boldsymbol x^{(k)}$ , 则有
$\nabla_x\varphi(\boldsymbol x^{(k)},\boldsymbol \mu^{(k)})=\nabla f(\boldsymbol x^{(k)})+\sum_{i=1}^p\mu_i^{(k)} \nabla h_i(\boldsymbol x^{(k)})+c\sum_{i=1}^p h_i(\boldsymbol x^{(k)})\nabla h_i(\boldsymbol x^{(k)})=0.$
即
$\nabla f(\boldsymbol x^{(k)})+\sum_{i=1}^p(\mu_i^{(k)} +ch_i(\boldsymbol x^{(k)})\nabla h_i(\boldsymbol x^{(k)})=0.$
将其与 $\nabla L(\boldsymbol x^{(k)},\boldsymbol \mu^{(k)})$ 比较可得
$\mu_i^{(k+1)}=\mu_i^{(k)}+ch_i(\boldsymbol x^{(k)}), i=1,...,p.$
迭代终止条件？

**Theorem ** 设 $\boldsymbol x^{(k)}$ 是 $\min\varphi(\boldsymbol x,\boldsymbol \mu^{(k)})$ 的最优解, 则 $\boldsymbol x^{(k)}$ 是原约束优化问题的最优解 $\Leftrightarrow h_i(\boldsymbol x^{(k)})=0,i=1,...,p.$

因此, 迭代终止条件可取为: 给定计算精度 $\varepsilon>0,$ 若 $\boldsymbol x^{(k)}$ 满足 $\|h(\boldsymbol x^{(k)})\|<\varepsilon$ , 则停止迭代, 输出最优解 $\boldsymbol x^{(k)}$ . 此外, 若迭代过程中, $\boldsymbol \mu^{(k)}$ 收敛太慢, 可适当增大因子 $c$ .

算法流程

步骤1 给定初始点 $x^{(0)}$ , 初始乘子向量 $\boldsymbol \mu^{(1)}$ (可取 $\boldsymbol \mu^{(1)}=\boldsymbol 0$ ), $\varepsilon>0,c>0,0<r<1,\alpha>1$ , 令 $k = 1$ ;

步骤2 以 $\boldsymbol x^{(k-1)}$ 为初始点, 求解 $\min\varphi(\boldsymbol x,\boldsymbol \mu^{(k)})$ , 得 $\boldsymbol x^{(k)}$ ;

步骤3 若 $\|h(\boldsymbol x^{(k)})\|<\varepsilon$ , 迭代终止, $\boldsymbol x^{(k)}$ 为最优解; 否则, 计算 $\beta=\frac{\|h(\boldsymbol x^{(k)})\|}{\|\boldsymbol x^{(k-1)}\|}$ , 若 $\beta> r$ , 则 $c=\alpha c$ ;

步骤4 $\mu_i^{(k+1)}=\mu_i^{(k-1)}+ch_i(\boldsymbol x^{(k)}), i=1,...,p+1$ , 令 $k = k + 1$ , 返回步骤1.

Rockafellar乘子法

Rockafellar将乘子法推广到不等式约束的优化问题
$\begin{align*} & \min f(x)\\ & s.t. g_i(x)\ge 0,i=1,...,p. \end{align*}$

通过引入松弛变量 $z_i(i=1,...,p)$ , 将不等式约束转化为等式约束
$g_i(x)-z_i^2=0,i=1,...,p.$
考虑其对应的增广 $L a g r an g e$ 函数
$\Phi(\boldsymbol x,\boldsymbol z,\boldsymbol \mu)=f(\boldsymbol x)+\sum_{i=1}^p\mu_i[g_i(\boldsymbol x)-z_i^2]+\frac{c}{2}\sum_{i=1}^p[g_i(\boldsymbol x)-z_i^2]^2.$
将 $\Phi(\boldsymbol x,\boldsymbol z,\boldsymbol \mu)$ 关于 $\boldsymbol z$ 求极小,
$\varphi(\boldsymbol x,\boldsymbol \mu)=\min_{\boldsymbol z}\Phi(\boldsymbol x,\boldsymbol z,\boldsymbol \mu),\nabla_{\boldsymbol z}\Phi(\boldsymbol x,\boldsymbol z,\boldsymbol \mu)=0,$
得
$z_i[cz_i^2-(\mu_i+cg_i(\boldsymbol x))]=0,i=1,...,p.$
若 $\mu_i+cg_i(\boldsymbol x)\le 0$ , 则 $z_i^2=0$ ; 若 $\mu_i+cg_i(\boldsymbol x)> 0$ , 则 $z_i^2=\frac{1}{c}(\mu_i+cg_i(x))$ , 即
$g_i(\boldsymbol x)-z_i^2= \begin{cases} g_i(\boldsymbol x),\mu_i+cg_i(\boldsymbol x)\le 0,\\ -\frac{\mu_i}{c},\mu_i+cg_i(\boldsymbol x)> 0. \end{cases}$
当 $\mu_i+cg_i(\boldsymbol x)\le 0$ 时,
$\mu_i[g_i(\boldsymbol x)-z_i^2]+\frac{c}{2}[g_i(\boldsymbol x)-z_i^2]^2=\mu_ig_i(\boldsymbol x)+\frac{c}{2}[g_i(\boldsymbol x)]^2=\frac{1}{2c}[(\mu_i+cg_i(\boldsymbol x))^2-\mu_i^2],$
当 $\mu_i+cg_i(\boldsymbol x)> 0$ 时,
$\mu_i[g_i(\boldsymbol x)-z_i^2]+\frac{c}{2}[g_i(\boldsymbol x)-z_i^2]^2=-\frac{\mu_i^2}{c}+\frac{c}{2}(-\frac{\mu_i}{c})^2=-\frac{1}{2c}\mu_i^2.$
故
$\varphi(\boldsymbol x,\boldsymbol \mu)=f(\boldsymbol x)+\frac{1}{2c}\sum_{i=1}^p\{[\min(0,\mu_i+cg_i(\boldsymbol x))]^2-\mu_i^2\}.$
可得乘子迭代公式
$\mu_i^{(k+1)}=\min\{0,\mu_i^{(k)}+cg_i(\boldsymbol x^{(k)})\},$
迭代终止准则
$(\sum_{i=1}^p[\min(g_i(\boldsymbol x),-\frac{\mu_i}{c})]^2)^{\frac{1}{2}}<\varepsilon.$

应用举例

例1 等式约束问题

求解
$\begin{align*} & \min f(x_1,x_2)=x_1^2+x_2^2\\ & s.t. x_1+x_2-2=0. \end{align*}$
易知其最优解为 $1,1)^T$ .

解: 增广 $L a g r an g e$ 函数为
$\varphi(x_1,x_2,\mu,c)=x_1^2+x_2^2+\mu(x_1+x_2-2)+\frac{c}{2}(x_1+x_2-2)^2.$
令 $\frac{\partial \varphi}{\partial x_1}=\frac{\partial \varphi}{\partial x_2}=0$ , 得
$x_1=x_2=\frac{2c-\mu}{2c+2}.$
则有
$\mu^{(k+1)}=\frac{1}{c+1}\mu^{(k)}-\frac{2c}{c+1}.$
取 $c = 10,$ 则 $\mu^{(k+1)}=\frac{1}{11}\mu^{(k)}-\frac{20}{11}$ . 设 $\mu^{(k)}\rightarrow \mu^*$ , 可得
$\mu^*=\frac{1}{11}\mu^{*}-\frac{20}{11} \Rightarrow u^*=-2.$
则原问题最优解 $\boldsymbol x^*=(1,1)^T.$

例2 不等式约束优化问题

求解
$\begin{align*} & \min f(\boldsymbol x)=x_1^2+x_2^2\\ & s.t. x_1-1\ge 0. \end{align*}$
易知最优解为 $1,0)^T.$

解: 增广 $L a g r an g e$ 函数为
$\varphi(x_1,x_2,\mu,c)=x_1^2+x_2^2+\frac{1}{2c}\{[\min (0,\mu+c(x_1-1))]^2-\mu^2\}\\= \begin{cases} & x_1^2+x_2^2+\mu(x_1-1)+\frac{c}{2}(x_1-1)^2, x_1\le 1-\frac{\mu}{c},\\ & x_1^2+x_2^2-\frac{\mu^2}{2c},x_1> 1-\frac{\mu}{c}. \end{cases}$

$\frac{\partial \varphi}{\partial x_1}= \begin{cases} 2x_1+\mu+c(x_1-1),x_1\le 1-\frac{\mu}{c}\\ 2x_1,x_1> 1-\frac{\mu}{c} \end{cases} , \frac{\partial \varphi}{\partial x_2}=2x_2.$

令 $\nabla\varphi(\boldsymbol x,\boldsymbol \mu)=0$ , 得极小点
$x_1=\frac{c-\mu}{c+2},x_2=0.$
取 $c = 4,$ 有
$\begin{align*} & \boldsymbol x^{(k)}=(\frac{4-\mu^{(k)}}{6},0)^T,\\ & \mu^{(k+1)}=\min\{0,\mu^{(k)}+4(x_1^{(k)}-1)\}=\frac{\mu^{(k)}-4}{3}. \end{align*}$
令 $k\rightarrow+\infty, \mu^{(k)}\rightarrow -2, \boldsymbol x^{(k)}\rightarrow (1,0)^T=x^*$ .

Code

以例1中的等式约束问题为练习, 给出简易MATLAB代码, 可以看出数值结果与理论相符.

% 等式约束的乘子法
function multph
global c miu
x0=[2,1]';
x1=x0;
miu=0;
eps=10^(-4);
c=10;
r=0.4;
a=2;
k=1;
while norm(h(x0))>=eps
    x1=fminsearch('phi',x0);
    beta=norm(h(x1))/norm(h(x0));
    x0=x1;
    if beta>r
        c=a*c;
    end
    miu=miu+c*h(x1);
    k=k+1;
end
format long
disp('最优解')
disp(x1)
disp('乘子')
disp(miu)
disp('迭代次数')
disp(k)
disp('终止条件')
disp(h(x0))
end

function r=h(x)
% 等式约束对应函数
r=x(1)+x(2)-2;
end

function r=phi(x)
global miu c
r=x(1)^2+x(2)^2+miu*(x(1)+x(2)-2)+c/2*(x(1)+x(2)-2)^2;
end

最优解
   1.000053801333254
   0.999968661617259

乘子
  -1.999646326786757

迭代次数
     6

终止条件
     2.246295051211433e-05

Daytoy Studio

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录