2023-10-15-增广拉格朗日方法在iLQR算法中的应用

xinyu_khan

已于 2024-02-21 17:10:15 修改

阅读量1.2k

点赞数 19

分类专栏：知识分享文章标签：算法机器人

于 2024-02-21 17:08:53 首次发布

本文链接：https://blog.csdn.net/hxy_1993_08_18/article/details/136216291

版权

本文介绍了增广拉格朗日方法在iLQR算法中处理约束条件的应用，详细阐述了从约束优化问题、增广拉格朗日法的迭代公式到更新乘子和惩罚系数的整个流程。

摘要由CSDN通过智能技术生成

增广拉格朗日方法在iLQR算法中的应用

背景

在之前的文章《iLQR算法公式推导》中，我们推导了iLQR算法在无约束情况下的迭代公式，但是在实际应用中，我们往往需要考虑约束条件。本文将介绍如何使用增广拉格朗日法Augmented Lagrangian Methods来处理约束条件。

约束优化问题

具有约束的优化问题具有如下形式：

$\begin{aligned} \min_{x_{0:N},u_{0:N-1}} \quad & \ell_N(x_N)+\sum_{k=0}^{N-1}\ell_k(x_k,u_k)\\ s.t. \quad & x_{k+1}=f(x_k,u_k),\quad k=0,\cdots,N-1\\ & g_k(x_k,u_k)\leq 0,\\ & h_k(x_k,u_k)=0, \end{aligned} \tag{1}$

其中 $k$ 是时间步， $x_k\in\mathbb{R}^{n_x}$ 是状态， $u_k\in\mathbb{R}^{n_u}$ 是控制量， $f$ 是状态转移函数， $\ell_f$ 是终端损失函数， $\ell_k$ 是中间损失函数， $g_k$ 是不等式约束， $h_k$ 是等式约束。

增广拉格朗日法

将约束优化问题转化为增广拉格朗日函数的形式：

$\begin{aligned} \mathcal{L}(x_{0:N},u_{0:N-1},\lambda_{0:N},\mu_{0:N-1})&=\ell_N(x_N)+(\lambda_N + \frac{1}{2}I_{\mu_N}c_N(x_N))^Tc_N(x_N)\\ &+\sum_{k=0}^{N-1}\left[\ell_k(x_k,u_k)+(\lambda_k + \frac{1}{2}I_{\mu_k}c_k(x_k,u_k))^Tc_k(x_k,u_k)\right]\\ &=\mathcal{L}_N(x_N,\lambda_N,\mu_N)+\sum_{k=0}^{N-1}\mathcal{L}_k(x_k,u_k,\lambda_k,\mu_k), \end{aligned} \tag{2}$

其中 $\lambda_k\in\mathbb{R}^{p_k}$ 是拉格朗日乘子， $\mu_k\in\mathbb{R}^{p_k}$ 是惩罚系数， $c_k=(g_k,h_k)\in\mathbb{R}^{p_k}$ 是不等式约束和等式约束的组合，相应的，不等式约束的序号和等式约束的序号的集合分别是 $\mathcal{I}_k$ 和 $\mathcal{E}_k$ ， $I_{\mu_k}$ 是对角矩阵，它的定义如下：

$I_{\mu_k,ii}= \begin{cases} 0, & \text{if $c_{k_i}<0$ $\land$ $\lambda_{k_i} = 0$},i\in\mathcal{I}_k\\ \mu_{k_i}, & \text{otherwise}, \end{cases} \tag{3}$

其中 $k_i$ 表示第 $k$ 个时间步的第 $i$ 个约束， $c_{k_i}$ 表示第 $k$ 个时间步的第 $i$ 个约束的值， $\lambda_{k_i}$ 表示第 $k$ 个时间步的第 $i$ 个约束的拉格朗日乘子， $\mu_{k_i}$ 表示第 $k$ 个时间步的第 $i$ 个约束的惩罚系数。