约束优化算法(1) Lagrangian乘子法 #notebook

倔强青铜ⅳ

已于 2024-03-17 22:33:54 修改

阅读量763

点赞数 34

文章标签：算法机器学习人工智能

于 2024-03-17 22:27:22 首次发布

本文链接：https://blog.csdn.net/weixin_53162487/article/details/136791856

版权

本文来自 矩阵分析与应用，第二版。
约束优化算法的标准处理方式是将其转化为无约束优化算法，有三种常见的转化方式，分别是lagrangian乘子法，罚函数法以及增广lagrangian乘子法（lagrangian乘子法+罚函数法）。
下面分别介绍拉格朗日乘子法。

拉格朗日乘子法

考虑等式约束的凸优化问题
$\min f(\boldsymbol{x})\quad\text{subject to }A\boldsymbol{x}=\boldsymbol{b} \tag{1}$
其中 $\in \mathbb{R}^{n},A \in \mathbb{R}^{m \times n}$ ,并且目标函数 $\mathbb{R}^n \rightarrow \mathbb{R}$ 是凸函数。

lagrangian乘子法将式(1)变成无约束最小化问题，其lagrangian目标函数为
$L(x,\lambda)=f(x)+\lambda^{\mathrm{T}}(Ax-b) \tag{2}$
原始优化问题(1)的对偶目标函数为
$g(\lambda)=\inf_{\boldsymbol{x}}L(\boldsymbol{x},\boldsymbol{\lambda})=-f^{\star}(-\boldsymbol{A}^{\mathrm{T}}\boldsymbol{\lambda})-\boldsymbol{b}^{\mathrm{T}}\boldsymbol{\lambda} \tag{3}$
其中 $\lambda$ 为对偶变量或者称为Lagrangian乘子向量， $f^{\star}$ 是 $f$ 的凸共轭函数。

$-\sup_{x\in D}f(x)=\inf_{x\in D}\{-f(x)\}$

借助lagrangian乘子法，原始等式约束极小化式(1)变成对偶极大化问题
$\max_{\lambda\in\mathbb{R}^{m}}g(\lambda)=-f^{*}(-A^{\mathrm{T}}\lambda)-b^{\mathrm{T}}\lambda \tag{4}$

假定强对偶性满足，则原始问题和对偶问题的最优解相同。此时，原始极小化问题式(1)的最优解点 $\boldsymbol{x}^*$ 即可由下式恢复
$\boldsymbol{x}^* = \underset{\boldsymbol{x}}{\arg \min} L(\boldsymbol{x},\boldsymbol{\lambda}^\star) \tag{5}$

在对偶上升法(dual ascent method)中，利用梯度上升法求解极大化问题式(4)。对偶上升法由两个步骤组成
$\begin{align*} \boldsymbol{x}_{k+1} = \underset{\boldsymbol{x}}{\arg \min} L(\boldsymbol{x},\boldsymbol{\lambda}_k) \tag{6} \\ \boldsymbol{\lambda}_{k+1} = \boldsymbol{\lambda}_{k} + \mu_k(\boldsymbol{A} \boldsymbol{x}_{k+1} - \boldsymbol{b}) \tag{7} \end{align*}$

其中式(6)为原始变量 $\boldsymbol{x}$ 极小化步骤,式(7)则是对偶变量 $\boldsymbol{\lambda}$ 更新步骤，其步长为 $\mu_{k}$

由于对偶变量 $\lambda \succeq 0$ 可解释为一价格向量，所以对偶变量的更新也叫价格上升(price ascent)或价格调整(price adjustment)步骤。价格上升的目的就是使收益函数 $g(\boldsymbol{\lambda}^k)$ 趋近于最大化。

对偶上升法包含有两层含义:

对偶变量 $\boldsymbol{\lambda}$ 的更新采用梯度上升法
通过步长 $\mu_k$ 的适当选择，保证对偶目标函数的上升,即 $g(\boldsymbol{\lambda}^{k+1}) >g(\boldsymbol{\lambda}^k)$

思维导图

Convex Optimization with Equality Constraints
│
├── Lagrangian Multiplier Method
│   ├── Origin: Optimization Problem
│   │   └── min f(x) subject to Ax = b
│   │
│   └── Transform: Lagrangian Function
│       └── L(x,λ) = f(x) + λᵀ(Ax - b)
│
├── Dual Objective Function
│   └── Derive: Dual Function
│       └── g(λ) = inf_x L(x, λ)
│           └── = -f* (-Aᵀλ) - bᵀλ
│
├── Dual Ascent Method
│   ├── Objective: Maximize λ g(λ)
│   │   └── = -f* (-Aᵀλ) - bᵀλ
│   │
│   ├── Step 1: Minimize L(x, λk) for x
│   │   └── x(k+1) = arg min_x L(x, λk)
│   │
│   └── Step 2: Update λ
│       └── λ(k+1) = λk + μk(Ax(k+1) - b)
│           └── Price ascent or adjustment step
│
└── Strong Duality
    ├── Assumption: Strong Duality Satisfied
    │
    └── Recover Solution: Optimal x*
        └── x* = arg min_x L(x, λ*)

参考

矩阵分析与应用，第二版

倔强青铜ⅳ

关注

34
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
约束优化算法(1) Lagrangian乘子法 #notebook

本文来自。约束优化算法的标准处理方式是将其转化为无约束优化算法，有三种常见的转化方式，分别是lagrangian乘子法，罚函数法以及增广lagrangian乘子法（lagrangian乘子法+罚函数法）。下面分别介绍。
复制链接

扫一扫