读PythonRobotics StateLatticePlanner源码-原理篇

本文链接：https://blog.csdn.net/liuerin/article/details/117083514

文章目录

- - 1.原理

代码地址: https://github.com/AtsushiSakai/PythonRobotics
涉及两篇论文:

Optimal rough terrain trajectory generation for wheeled mobile robots
这篇是通过优化控制参数的方式，找满足两点边界约束的最优路径问题。
State Space Sampling of Feasible Motions for High-Performance Mobile Robot Navigation in Complex Environments
这篇涉及state space采样，不考虑环境的均匀采样，或考虑global cost的稀疏采样，以及考虑路径环境约束或切换道路的采样。采样后利用第一篇最优路径方法生成两点间路径。

大家都知道state lattice基本思想是

sample in control space。在控制空间采样，通过状态转移方程向前积分。缺点是没有任务导向。
$\begin{aligned} \dot{s} &= A \cdot s + B \cdot u \\ s(t) &= e^{At}s_0 + \big[\int_0^t e^{A(t-\sigma)}Bd\sigma\big]u \end{aligned}$
sampling in state space。在状态空间采样，通过解OBVP问题，求出u(t)。缺点是解题难。

对比图在这里插入图片描述
代码中为在状态空间采样

1.原理

看下求解路径的理论知识，再对应代码。大部分来自两篇论文

1.1 Pontryain’s minimum principle

不是论文中的内容，但是个典型的OBVP问题求解方式。

二阶系统参考:用庞特里亚金极小值原理求解二阶系统的最优控制问题
三阶类似无人机系统，其中 $s=(p,v,a),u=j_{jerk},\dot{s}=f_s(s,u)=(v,a,j)$ ，哈密顿函数为 $H(s,u,\lambda) = \frac{1}{T}j^2 + \lambda^Tf_s(s,u)$ ，解法相同

1.2 Numerical Optimization

来自第一篇论文。论文中涉及二阶模型，例如车。

1.2.1论文中基础信息

边界state定义为(起点和终点)，包括位置 $(x,y,\psi)$ ，速度 $(v)$ ，角速度 $(\omega)$ （或曲率 $k$ ，不知道为啥叫curvature，看代码似乎和角速度是一个东西）
$\begin{aligned} X_0 &= [x_0,y_0,\psi_0,v_0,\omega_0]^T\\ X_f &= [x_f,y_f,\psi_f,v_f,\omega_f]^T\\ \end{aligned}$
状态微分方程和状态限制(state constraints C)(指规划的轨迹在 $t=t_f$ 时，状态 $X(t_f)$ 需要等于目标状态 $X_f$ )
$\begin{aligned} \dot{x} &= f(x,u,t) \\ C(x,t) &=0 = X_f - X(t_f) \end{aligned}$
把控制量(controls)参数化，其中 $p$ 是参数向量， $\xi$ 的独立变量

$f(p,\xi)$

对于独立变量 $\xi$ ，一般是 $(t, s)$ ，时间和弧长
对于参数 $p$ ，针对速度模型，角速度(或曲率)模型区分
- 对于线性速度，模型可以是固定速度、线性速度、T型曲线等，可以允许数值线性化的模型。论文中选取T型曲线。参数列表为
  $=[v_0,a_0,v_{traverse},a_f,v_f,\Delta t]^T$
  
  初始速度 $v_0$ ，初始加速度 $a_0$ ,终止速度 $v_f$ ，终止加速度 $a_f$ ，中间速度 $v_{traverse}$ ，时间间隔 $\Delta t$ (pythonRobotics中这里固定了速度，猜想如果用T-curve实现， $a_f,v_f$ 可以通过采样或固定生成， $\Delta t$ 可以通过采样终止位置，计算起始到终止位置的弧长，再通过速度计算)
- 对于角速度，模型可以用样条曲线，一种参数直接是多次项的系数，即
  $\begin{aligned} p &= [a,b,c,d,\Delta t]^T \\ \omega(p,t)&= a+bt+ct^2+dt^3+\cdots \end{aligned}$
  
  另一种参数是曲线上几个点，通过拟合曲线获得曲线方程
  $\begin{aligned} p &= [\omega_0,\omega_1,\omega_2,\cdots,\Delta t]^T \quad(指参数)\\ \omega_0 &= \omega(t_0),\omega_1=\omega(t_0+\Delta t/n) \quad(代表参数的物理意义)\\ \hat{a} &= f_1(p),\hat{b} = f_2(p), \hat{c} = f_3(p),\cdots \quad(代表实际曲线系数是由参数拟合得到)\\ \omega(p,t)&= \hat{a}+\hat{b}t+\hat{c}t^2+\hat{d}t^3+\cdots \quad(实际的曲线方程)\\ \end{aligned}$
pythonRobotics中的代码使用了第二种参数表示方式，具体是 $s,k_m,k_f]$ ，代表起点到采样的终点状态的弧长， $\Delta t/2$ 时的曲率(或称角速度)， $\Delta t$ 时的曲率。其实计算二次曲线实际参数时还需要初始点的曲率 $k_0$ ，但这一般是已知量，所以不放在参数中。并且代码中拟合的是二次曲线，大概因为第二篇论文中提到二次项就足够了。

1.2.2 Constrained Trajectory Generation

对应论文中的2.3.1节。这里利用数值优化，每步迭代优化控制参数 $p$ ，使得在控制量 $u (p, t)$ 的控制下，从初始状态 $X_0$ 逐渐向前积分变化到 $X(t_f)$ 时，逐渐缩小 $X_f - X(t_f)$ 的差距，使得满足约束条件 $C (x)$ 。
优化方法为牛顿迭代，求取残差 $\Delta x_f(p)$ 相对参数 $p$ 的Jacobian矩阵，找到一个参数 $p$ 的迭代变化量 $\Delta p$ ，使得残差在下次计算时能够缩小。
$\begin{aligned} \big[ \frac{\partial \Delta X_f(p)}{\partial p}\big] \Delta p = -\Delta X_f(p) = X_f - X(t_f) \\ \Delta p = - \big[ \frac{\partial \Delta X_f(p)}{\partial p}\big]^{-1}\Delta X_f(p) \end{aligned}$

其中Jacobian没有办法直接计算，可以通过下式计算
$\begin{aligned} \frac{\partial \Delta_{i,j} X_f(p)}{\partial p_k} &= \frac{\Delta X_{i,j}(p_k +e,p) - \Delta X_{i,j}(p) }{e} \\ \frac{\partial \Delta_{i,j} X_f(p)}{\partial p_k} &= \frac{\Delta X_{i,j}(p_k +e,p) - \Delta X_{i,j}(p_k -e,p)}{2e} \end{aligned}$
其中

$i, j$ 代表状态量 $X$ 矩阵的 $i 行 j 列$ ,
$k$ 代表参数 $p$ 的第 $k$ 个参数。

这里表达式的意思式，当有参数 $p$ ，想求解残差 $\Delta X_f =X(t_f) -X_f$ 的雅克比，可以通过近似求解：

固定当前 $p$ 上第 $k$ 项以外的参数，给第 $k$ 项参数增加或减少一个小小的扰动 $e$ ，变为 $p_k+e$ 或 $p_k-e$
使用扰动过的参数 $(p_k\pm e,p)$ ，从起始状态 $X_0$ 向前积分，得到新参数下的轨迹终态 $X_{p_k \pm e}(t_f)$
求解新参数下的残差 $\Delta X(p_k \pm e,p)$
利用上面的公式近似求解第 $k$ 个参数的偏导
每个参数循环扰动，最终得到对整个参数 $p$ 的Jacobian

pythonRobotics代码中就使用这种迭代方法

1.2.3 Constrained Optimization Trajectory Generation

对应论文的2.3.2节。使用最优控制解出唯一解。其中参数 $p$ 必须满足约束，并最小化目标函数(utility functional) $J (p)$ （过程中想要优化的量）。哈密顿方程 $H$ (利用拉格朗日乘子 $\lambda$ )定义为
$\begin{aligned} H(p,\lambda) &= J(p) + \lambda^T\Delta X_f(p) = J(p) + \lambda^T(x_f - X(t_f)) \\ J(p) &= \int_{t_0}^{t_f} Y(x,p,t) dt \end{aligned}$
论文中有提到的 $Y$ 有
$\begin{aligned} J(u) &= \int_{t_0}^{t_f} Y(x,u,t) = \int_{t_0}^{t_f}1 + \alpha cost(x,y) dt \\ J(u) &= \int_{t_0}^{t_f} Y(x,u,t) = \int_{t_0}^{t_f} 1+\alpha (\phi^2 + \theta^2) dt \end{aligned}$
第一个是对时间和能量消耗的tradeoff，第二个是为了减少在斜坡上的时间，对roll和pitch做惩罚。以适应不同地形。

最优条件下的一阶微分方程：
$\begin{aligned} \frac{\partial H(p,\lambda)}{ \partial p} &= \frac{\partial J(p)}{\partial p} + \lambda ^T\frac{\partial \Delta X_f(p)}{\partial p} =0^T \\ \frac{\partial H(p,\lambda)}{ \partial \lambda} &= \Delta X_f(p) =0 \end{aligned}$
同样经过迭代求取参数 $p$ 和 $\lambda$ 的最优解。
$\begin{bmatrix} \frac{\partial^2H(p,\lambda)}{\partial p^2} & \frac{\Delta X_f(p)^T}{\partial p} \\ \frac{\Delta X_f(p)^T}{\partial p} & 0 \end{bmatrix}\begin{bmatrix}\Delta p \\ \Delta \lambda\end{bmatrix} = - \begin{bmatrix} \frac{\partial H(p,\lambda)}{\partial p} \\\Delta X_f(p)\end{bmatrix}$
(不知道其中的 $\frac{\partial^2H(p,\lambda)}{\partial p^2} \Delta p + \frac{\Delta X_f(p)^T}{\partial p} \Delta \lambda = -\frac{\partial H(p,\lambda)}{\partial p}$ 来源是啥，大胆猜测下，由于 $\frac{\partial H(p,\lambda)}{\partial p}$ 需要为0，就和残差的牛顿法同理，正好 $\frac{\partial^2H(p,\lambda)}{\partial p\partial \lambda}=\frac{\Delta X_f(p)^T}{\partial p}$
$\frac{\partial^2H(p,\lambda)}{\partial p^2} \Delta p + \frac{\partial^2H(p,\lambda)}{\partial p\partial \lambda} \Delta \lambda = -\frac{\partial H(p,\lambda)}{\partial p}$ )
其中哈密顿方程 $H$ 对于参数 $p$ 的Hessian矩阵，可以通过下式求解
$\frac{\partial^2H_{i,j}(p)}{\partial p_k\partial p_k} = \frac{H_{i,j}(p_k+e,p_l+e,p)-H_{i,j}(p_k+e,p)-H_{i,j}(p_l+e,p)+H_{i,j}(p)}{e^2}$

1.2.4向前积分

$X(t+\Delta t) = X(t) + \dot{X}(X,u,t)\Delta t$

1.2.5 lookup table

当状态空间是低维并且光滑，lookup table可以用来对最优参数进行猜测。由于一般使用初始和最终位置(x,y)、角度 $\psi$ 、和初始和最终的曲率 $k_0,k_f$ 作为边界条件，因此lookup table使用这5维参数作为查询条件，查询最优参数的初始猜测。
在这里插入图片描述
代码中把(0,0)坐标作为初始状态，采样不同的终点位置、终点航向、初始曲率，利用牛顿迭代计算最优参数，存储在表中。在规划时，从表中查找最接近终点状态和初始曲率的那个参数，作为用于迭代的最初参数，以便参数快速收敛。

1.3.状态空间采样

来自第二篇论文。

1.3.1局部规划的算法框架为

在这里插入图片描述

算法输入：
- $p_{ss}$ 参与状态空间采样的参数向量
- $X_I$ 初始状态
- $f (x, u (p, x))$ 运动微分方程
算法输出:
- $u_N(p_N,x)$ ，对于不同的终止状态 $X_N$ ，生成控制量 $u_N$ ，及对应的最优参数 $p_N$
- $c_N$ ，不同终止状态的cost
算法内容:
- 根据采样参数 $p_{ss}$ 及初始状态 $X_I$ ，生成采样集合 $X_N$
- 循环采样集合 $X_N$ 中的每个状态 $X_F$
  - 按照初始状态 $X_I$ ，最终状态 $X_F$ ，及微分方程 $f (x, u (p, x))$ ，生成最优控制量 $u_i(p_i,x)$
  - 如果控制量有效，计算轨迹的cost $c_i$
- 返回所有控制量集合 $c_N$ 和cost集合 $c_N$

1.3.2 均匀采样边界状态伪代码

在这里插入图片描述

算法输入
- $p_{ss}$ 参与状态空间采样的参数， $p_{ss} = [n_p,n_h,d,\alpha_{min},\alpha_{max},\psi_{min},\psi_{max}]^T$
  - $n_p$ ，位置(position)采样的个数
  - $n_h$ ，航向(heading)采样的个数
  - $d$ ，初始点到终点的直线距离
  - $\alpha_{min},\alpha_{max}$ , 位置采样的角度范围
  - $\psi_{min},\psi_{max}$ , 航向角偏移量的角度范围
- $X_I$ 初始状态
算法输出
- $X_N$ 采样的边界状态集合
算法内容
- 按照位置采样的角度范围均匀采样角度，生成位置坐标 $(x, y)$
- 按照航向角角度范围均匀采样，对起点到终点的方向进行偏移

下图表示不同的初始角速度，相同的均匀采样生成的终止边界状态。
在这里插入图片描述

1.3.3 有global guidance的边界状态采样

主要思想是全局规划器会有一个cost判断，走到cost高的地方，再向目标点出发，会有更低的概率走出一条效率高且feasible的路，因此在采样阶段，在cost低的地方稠密的采样，在cost高的地方更稀疏的采样。
在这里插入图片描述

算法输入
- $p_{ss}$ 参与状态空间采样的参数， $p_{ss} = [n_s,n_p,n_h,d,\alpha_{min},\alpha_{max},\psi_{min},\psi_{max}]^T$
  - $n_s$ ，global guide navigation function 采样数目
- $X_I$ 初始状态
算法输出
- $X_N$ 采样的边界状态集合
算法内容
- 均匀采样navigation function，按照 $n_s$ 把均匀采样角度计算坐标用global guide 计算cost (如点到目标点的距离 $\psi$ ，距离越远cost越大)
- 通过计算最大值和采样值的差距除以cost总和的方式创建一个分布
- 对这个分布积分 $\int_{\alpha_{min}}^\alpha cnav$ ，最这个积分进行均匀采样，生成对终止位置角度 $\alpha$ 的非均匀采样
- 生成位置
- 均匀采样航向角进行偏移

在这里插入图片描述

1.3.4 环境约束的边界采样

考虑到道路的形状，在沿道路向前一定距离、垂直于道路中心线的横切线上采样，或者使用躲避障碍物和切换道路的策略。

在这里插入图片描述

算法输入
- $p_{ss}$ 参与状态空间采样的参数， $p_{ss} = [l_{center},l_{heading},l_{width},v_{width},d,n_p,n_l]^T$
  - $l_{center}$ ，道路中心线的集合
  - $l_{center}$ , 道路的航向
  - $l_{width}$ ，道路的宽
  - $v_{width}$ ，车宽
  - $d$ ，沿道路向前的弧长
  - $n_p$ ，每条路线上横向偏移的采样数目
  - $n_l$ ，路线数目
- $X_I$ 初始状态
算法输出
- $X_N$ 采样的边界状态集合
算法内容
- 对于每条路，沿道路中心线向前移动 $d$ 距离时道路的中心坐标 $x_{center}$
- 按照每条路的采样数目，计算采样点距路线中心的偏移量
- 计算路线的航向
- 根据路线中心偏移量计算边界状态坐标

在这里插入图片描述