数值优化（Numerical Optimization）学习系列-惩罚和增广拉格朗日方法（Augmented Lagrangian Methods）

最新推荐文章于 2024-12-20 09:28:24 发布

kkwant

最新推荐文章于 2024-12-20 09:28:24 发布

阅读量7.6k

点赞数

文章标签：增广拉格朗日方法惩罚方法 optimization methods 优化数值优化

本文介绍了解决约束最优化问题的惩罚方法及增广拉格朗日方法，包括二次惩罚方法、非平滑惩罚方法和增广拉格朗日方法的基本原理与求解框架。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原文地址为：数值优化（Numerical Optimization）学习系列-惩罚和增广拉格朗日方法（Augmented Lagrangian Methods）

概述

求解带约束的最优化问题，一类很重要的方法就是将约束添加到目标函数中，从而转换为一系列子问题进行求解，最终逼近最优解。关键问题是如何将约束进行转换。本节主要介绍
1. 二次惩罚方法
2. 非平滑惩罚方法
3. 增广拉格朗日方法

二次惩罚方法

动机

带约束问题如果转换为目标函数加上一个对约束的惩罚项，则问题转换为一个无约束问题。
转换后的问题可以通过惩罚项的系数进行控制，一个比较常见的惩罚函数就是二次惩罚。

等式约束的最优化问题

等式约束问题可以表示为

m i n f (x) s . t c i (x) = 0, i \in E

添加一个二次惩罚项，则有

Q (x; μ) = f (x) + μ 2 \sum i \in E c 2 i (x)

其中

μ 是惩罚参数，直观上只要增加惩罚参数的值就可以逼近原始问题的最优解。
在实际中，对于某个惩罚参数

μ 只要几步无约束最优化问题，不需要寻找最优解。

一般化约束最优化问题

一般化约束最优化问题表示为

m i n f (x) s . t c i (x) = 0 i \in E c i (x) \geq 0 i \in I

添加惩罚项系数结果为

Q (x; μ) = f (x) + μ 2 \sum i \in E c 2 i (x) + μ 2 \sum i \in I ([c i (x)] -) 2

其中

ci(x)− 表示当该值大于0时，结果为0，否则为

−ci(x)

二次惩罚项通用框架

这里写图片描述

1.参数 μ 的选择可以根据无约束问题的优化难度进行确定，如果很容易优化则可以 μk+1=μk ，否则可以选择 μk+1=μk
2. 定理：如果转换后的问题 Q(x;μk) 每一步都计算最优解，并且当 μk→∞ 时能够接近原始问题的最优解。

非平滑惩罚函数

有些惩罚函数是精确的，即惩罚项参数 μ 达到一定值时转换后的问题的最优解就是原始问题的最优解，其中l1惩罚项就是精确的，表示如下

ϕ 1 (x; μ) = f (x) + μ \sum i \in E | c i (x) | + μ \sum i \in E | c i (x) | -

通用求解框架

这里写图片描述

增广拉格朗日方法

动机

增广拉格朗日方法在拉格朗日方法的基础上添加了二次惩罚项，从而使得转换后的问题能够更容易求解，不至于因条件数变大不好求。则转换后的问题为

L (x, λ; μ) = f (x) - \sum i \in E λ i c i (x) + μ 2 \sum i \in E c i (x) 2

在第K步迭代过程中，固定惩罚项参数

μ 和

λk ，此时优化x，根据最优化条件有

\nabla x L = \nabla f (x) - \sum i \in E (λ k i - μ k c i (x)) \nabla c i (x) = 0

对比最优性条件，应该有

∇f(x∗)=0;λ∗=λki−μkci(x) ，从而很自然的可以将

λk+1=λki−μkci(x)

等式约束通用框架

这里写图片描述

实际应用

在实际中，增广拉格朗日方法可以很有效的处理边界约束和线性约束最优化问题。

总结

了解通过将约束转换为惩罚项添加到目标函数上的方法，了解增广拉格朗日方法的动机。

转载请注明本文地址：数值优化（Numerical Optimization）学习系列-惩罚和增广拉格朗日方法（Augmented Lagrangian Methods）

博客等级

码龄7年

0
原创

339
点赞

1575
收藏

274
粉丝

关注

私信

热门文章

最新评论

Server 对象错误 'ASP 0177 : 800401f3'解决方法
Kailan_2021: 好文章！干练直接。而且骂的漂亮。按照楼主的思路我的问题也解决了，CreateObject的时候，我把ADODB.Record拼写错了。
Cells(Rows.Count, 1).End(xlUp).Row的含义
yizhicaidebuxing: “就是取第一列第一次出现的非空单元格的行号”错了吧？是第一列最后一次出现非空单元格的行号吧？
Excel操作 Microsoft.Office.Interop.Excel.dll的使用
GoldenLionKing: 博主你好，我想问一下如果是这样导出数据，那么我该如何指定导出数据起始行呢？在表里面worksheet.Range["A1", worksheet.Cells[rowCount + 1, colCount]].Value2 = dataArray;//直接把数组赋值给表，比一个个赋值要快的多
jQuery选择器this通过onclick传入方法以及Jquery中的this与$(this)初探，this传处变量等
Dreamer_萘茵: 十分感谢，解惑了！谢谢大佬哈哈哈
网站访问时提示ERR_CONNECTION_TIMED_OUT（操作超时）！
m0_73376939: 大哥，这个问题你后面解决了嘛，我也是这种情况，不知到怎么办了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。