Optimal Boundary Value Problem (OBVP) 学习笔记

Amos98

已于 2022-07-31 22:55:05 修改

阅读量3.9k

点赞数 22

分类专栏： Robotics 文章标签：算法学习自动驾驶

于 2022-03-04 19:32:23 首次发布

本文链接：https://blog.csdn.net/Amos98/article/details/123261802

版权

引言

Boundary value problem (BVP)：给出机器人在起始点与终止点的状态，设计出一条状态转移的轨迹。是stated sampled lattice planning的基础，在motion planning技术栈中的位置如下。
在这里插入图片描述
Optimal boundary value problem：按某种原则设计出一条最优轨迹。

建模

对于二维/三维空间中的机器人，通常在每个维度上分别进行轨迹设计。此处以三维空间中的无人机为例，考察其在一个轴向的运动。

无人机状态 $s = (p, v, a)$

使用jerk作为控制输入： $u = j$

状态方程：
$\dot{s}=f_s(s,u)=(v,a,j)$

目标：最小化jerk二次方的积分，即
$\min J : = \frac{1}{T}\int_{0}^{T}j(t)^{2}dt$

待求解的量是 $u (t)$

求解

寻找最优轨迹的一般形式是极小化代价函数
$J=h(s(T))+\int_{0}^{T} g(s(t), u(t)) \cdot d t$
其中，第一项反映了末状态与理想状态的差别，可理解为惩罚项，第二项反映了状态转移过程的代价 (transition cost)。

为求解最优的 $u (t)$ （即最优 $j$ ），可以使用庞特里亚金极小值原理：引入costate $\lambda=(\lambda_1,\lambda_2,\lambda_3)$ ，（实际上是 $\lambda(t)=(\lambda_1(t),\lambda_2(t),\lambda_3(t))$ ，为形式简洁，将t省略）,构建Hamiltonian funciton
$\begin{aligned} H(s, j, \lambda) &=\frac{1}{T} j^{2}+\lambda^{T} f_{s}(s, j) \\ &=\frac{1}{T} j^{2}+\lambda_{1} v+\lambda_{2} a+\lambda_{3} j \end{aligned}$

在继续向下之前，首先简要介绍庞特里亚金极小值原理 (Pontryagin’s minimum principle)：

庞特里亚金极小值原理 (Pontryagin’s minimum principle)是最优控制范畴里的概念。wiki百科 - Pontryagin’s minimum principle
对于初始状态给定的问题，
$\dot{\lambda}(t)=-\nabla_{s} H\left(s^{*}(t), u^{*}(t), \lambda(t)\right) \\ \lambda的导数=-(H对p求导, H对v求导, H对a求导)$
最优控制输入为
$u^{*}(t)=\arg \min _{u(t)} H\left(s^{*}(t), u(t), \lambda(t)\right)$
如果 $h (s (T))$ 是连续的，还有terminal boundary condition成立:
$\lambda(T)=-\nabla h\left(s^{*}(T)\right)$

下面开始求解，由庞特里亚金极小值原理，
$\dot{\lambda}=-\nabla_{s} H\left(s^{*}, j^{*}, \lambda\right)=\left(0,-\lambda_{1},-\lambda_{2}\right)$

注意上式的意义： $\lambda(t)$ 这一向量第一项的导数为0，第二项的导数为第一项的相反数，第三项的导数为第二项的相反数。

引入待定系数 $\alpha,\beta,\gamma$ ，易写出
$\lambda(t)=\frac{1}{T}\left[\begin{array}{c} -2 \alpha \\ 2 \alpha t+2 \beta \\ -\alpha t^{2}-2 \beta t-2 \gamma \end{array}\right]$

进而，可得最优jerk
$\begin{aligned} j^{*}(t) &=\arg \min _{j(t)} H\left(s^{*}(t), j(t), \lambda(t)\right) \\ &= arg \min _{j(t)}\left [ \frac{1}{T} j^{2}+\frac{1}{T}(-\alpha t^{2}-2 \beta t-2 \gamma)j \right ] \\ &=\frac{1}{2} \alpha t^{2}+\beta t+\gamma \end{aligned}$

最低0.47元/天解锁文章