增广拉格朗日乘子法

一个欣语

已于 2022-07-23 12:30:11 修改

阅读量9k

点赞数 9

文章标签：矩阵

于 2022-07-20 20:36:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46007132/article/details/125866970

版权

在了解增广拉格朗日乘子法之前，先了解一下拉格朗日乘子法和罚函数。

拉格朗日乘子法

基本的拉格朗日乘子法(又称为拉格朗日乘数法)，就是求函数f(x1,x2,...)在约束条件下极值的方法。其主要思想是引入一个新的参数λ(即拉格朗日乘子)，将约束条件函数与原函数联系到一起，使能配成与变量数量相等的等式方程，从而求出得到原函数极值的各个变量的解。

假设目标函数为 $f(x)$ ，约束条件为 $h_{k}(x)$

$minf(x)\\s.t.h_{k}(x)=0,k=1,2,... ,l$

其中l表示有l个约束条件。

在这里我们举一个例子进行理解。

假设有一个方程为 $\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}-1=0$ 的椭球，我们要求这个椭球内接长方体的最大体积。

那么也就是说我们要在 $\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}-1=0$ 的条件下，求 $f(x,y,z)=8xyz$ 的最大值。

现在我们定义一个拉格朗日函数 $F(x,\lambda )$ ：

$F(x,\lambda )=f(x)+\sum_{k=1}^{l}\lambda_{k}h_{k}(x)$

其中 $\lambda _{k}$ 是各个约束条件的待定系数。

接下来求偏导为0的解：

$\frac{\partial F}{\partial x}=0,\frac{\partial F}{\partial \lambda }=0$

回到我们的题目，就可以将问题转化为：

$F(x,y,z,\lambda )=8xyz+\lambda(\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}-1)$

接下来对 $F(x,y,z,\lambda )$ 求偏导可得：

$\frac{\partial F(x,y,z,\lambda )}{\partial x}=8yz+\frac{2\lambda x}{a^{2}}=0$

$\frac{\partial F(x,y,z,\lambda )}{\partial y}=8xz+\frac{2\lambda y}{b^{2}}=0$

$\frac{\partial F(x,y,z,\lambda )}{\partial z}=8xy+\frac{2\lambda z}{c^{2}}=0$

$\frac{\partial F(x,y,z,\lambda )}{\partial \lambda }=\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}+\frac{z^{2}}{c^{2}}-1=0$

联立前三个方程并代入第四个方程后可以求出：

$x=\frac{\sqrt{3}}{3}a,y=\frac{\sqrt{3}}{3}b,z=\frac{\sqrt{3}}{3}c$

最后可得

$f(x,y,z)=8xyz=\frac{8\sqrt{3}}{9}abc$

罚函数

罚函数法是一种广泛采用的约束优化方法，用于解决约束条件下的最优化问题。

考虑我们的问题为：

$min f (x)\\ s.t.h_{j}(x)=0,j=1,2,3,.. .,p$

将原约束优化问题转变为无约束优化问题：

$minL_{p}(x)=f(x)+\rho p(x)$

其中 $\rho$ 表示惩罚参数。对于等式约束，我们可以定义罚函数为：

$\rho (x)=\sum_{j=1}^{p}|h_{j}(x)|^{2}$

如果满足约束条件则无影响，但是如果没有满足约束条件，则会施加惩罚。

对偶函数

对偶函数也称为拉格朗日对偶函数。

对于一个拉格朗日函数：

$F(x,\lambda,v)=f(x)+\lambda h(x)+vq(x)$

$s.t. h(x)\leqslant0,q(x)= 0$

我们称 $\lambda,v$ 为拉格朗日乘子（或对偶变量）。称 $x$ 为原变量。

拉格朗日函数就是一个关于 $x,\lambda,v$ 的函数

拉格朗日对偶函数的定义为：对于定义域D上x的所有取值，求拉格朗日函数的最小值即为拉格朗日对偶函数。

即：

$g(\lambda,v )=\inf_{x \in D}F(x,\lambda,v)$

其中inf （下确界）的定义：一个集合的最大下界。

对偶上升法

对于一个等式约束的优化问题：

$minf(x)$

$s.t. h(x)=0$

首先我们可以得到拉格朗日函数：

$F(x,\lambda )=f(x)+\lambda h(x)$

则对偶上升法的算法流程如下：

1.假设 $\lambda _{k}$ 是对偶问题的最优解。

2.求解 $minF(x,\lambda _{k})$ 。即在 $\lambda =\lambda _{k}$ 时不同x对应的F的值，F值最小处得到 $x_{k+1}$

3. $\lambda _{k+1}=\lambda _{k}+\alpha \frac{\partial F(x_{k+1} ,\lambda_{k} ) }{\partial \lambda_{k }}$

其中 $\alpha$ 称为步长，类似于学习率。

5.1-4迭代进行。

增广拉格朗日乘子法

拉格朗日乘子法的对偶上升法的主要缺点是要求约束优化目标具有局部凸结构。

罚函数的不足在于收敛慢，大的惩罚参数容易造成算法的数值不稳定性。

将两种方法结合起来的增广拉格朗日乘子法是能够减缓二者缺点的一种简单有效的途径。

我们假设优化问题只有等式约束：

$min f (x)\\ s.t.h(x)=0$

并对拉格朗日目标函数添加罚函数，如下：

$F(x,\lambda )=f(x)+\lambda h(x)+\rho p(x)$

这就是增广拉格朗日乘子法。若惩罚参数 $\rho$ 为0，则增广拉格朗日乘子法退化为拉格朗日乘子法；若 $\lambda$ 为0，则增广拉格朗日乘子法退化为罚函数法。

求最优解时使用对偶上升法

1.假设 $\lambda_{k}$ 是当前对偶问题的最优解

2.

$x_{k+1}= argmin F(x,\lambda _{k}) \\ \lambda _{k+1}=\lambda _{k}+\alpha \frac{\partial F(x_{k+1} ,\lambda_{k} ) }{\partial \lambda_{k }}$

3.1-2步迭代进行。

博客等级

码龄5年

90
原创

20
点赞

186
收藏

24
粉丝

关注

私信

热门文章

上一篇：: 矩阵分析与应用

下一篇：: 矩阵分析与应用

最新评论

矩阵分析与应用
m0_69194388: 第一点：（-1 0 a；0 1 b）是（-1 0；0 1；0 0）的左逆吗，请问该列满秩矩阵左逆唯一吗？第二点：请问你都得说左逆了（A^HA）^-1能利用公式打开吗，根本就没有A^-1你怎么还用它表示
矩阵分析与应用
m0_69194388: 第一点：（-1 0 a；0 1 b）是（-1 0；0 1；0 0）的左逆吗，请问该列满秩矩阵左逆唯一吗？第二点：请问你都得说左逆了（A^HA）^-1能利用公式打开吗，根本就没有A^-1你怎么还用它表示
矩阵分析与应用
後海25: 你好大佬我是初学者就是关于实内积空间里范数性质是不是默认是典范内积并且所有范数都满足啊
增广拉格朗日乘子法
喜扶马路老爷爷: 引用「拉格朗日乘子法」请问拉格朗日乘子法中，那个等式约束在拉格朗日函数里为什么没有平方呢？如果求拉格朗日函数的极大值的话，假如hk(x)很大，拉格朗日函数的值应该也会很大才对…我不太理解这个问题二，想请教一下增广拉格朗日对凸性质有无要求？感谢

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。