基于软约束的轨迹（路径）优化原理公式推导详解

最新推荐文章于 2023-07-09 12:17:28 发布

世界仙境与冷酷尽头

最新推荐文章于 2023-07-09 12:17:28 发布

阅读量2.1k

点赞数 4

分类专栏：算法文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/weixin_44673253/article/details/126578507

版权

算法专栏收录该内容

29 篇文章 83 订阅

订阅专栏

文章目录

0 回顾
1 软约束的轨迹优化
2 软约束轨迹优化方法的优缺点
3 Code

0 回顾

回顾 $M inim u m$ $S na p$ 当中的闭式求解的问题，闭式求解可以把轨迹变的更加顺滑，但是由于没有过多考虑障碍物的信息，可能会与障碍物发生碰撞。所以现在软约束的轨迹优化原理就是在原本顺滑性的基础上考虑代价碰撞函数，以及速度和加速度的限制。

在这里插入图片描述

1 软约束的轨迹优化

1.1 方法描述

优化方程： $\min \quad \lambda_{1} f_{s}+\lambda_{2} f_{o}+\lambda_{3}\left(f_{v}+f_{a}\right)$ ，前面的这个顺滑性 $f_{s}$ 就是之前在 $M inim u m$ $S na p$ 当中介绍过的表达式，又加入了 $f_{o}$ 碰撞目标函数，以及 $f_{v}$ 和 $f_{a}$ 速度和加速度的目标函数， $\lambda_{1}、\lambda_{2}、\lambda_{3}$ 是他们的权重系数。求解目标函数的最小值，可以采用梯度下降法。
轨迹依然是分成与 $M inim u m$ $S na p$ 当中的多段轨迹。
$p_{\mu}(t)=\left\{\begin{array}{lc} \sum_{j=0}^{N} \eta_{1 j}\left(t-T_{0}\right)^{j} & T_{0} \leq t \leq T_{1} \\ \sum_{j=0}^{N} \eta_{2 j}\left(t-T_{1}\right)^{j} & T_{1} \leq t \leq T_{2} \\ \vdots & \vdots \\ \sum_{j=0}^{N} \eta_{M j}\left(t-T_{M-1}\right)^{j} & T_{M-1} \leq t \leq T_{M} \end{array}\right.$

1.2 顺滑性目标函数的构建及其梯度

软约束轨迹优化方法是用来“完善” $M inim u m$ $S na p$ 方法的，也用到了 $M inim u m$ $S na p$ 当中的一些理论，有关 $M inim u m$ $S na p$ 的推导可以去看之前的博客。首先就是把参数的映射成每段轨迹两个端点的 $P V A$ （位置，速度，加速度）， $\eta=\mathbf{M}^{-1}\mathbf{C}\left[\begin{array}{l}\mathbf{d}_{F} \\\mathbf{d}_{P}\end{array}\right]$
这样做的目的就是，让系数突出其物理含义。其中， $d_{F}$ 表示端点需要固定的一些值， $d_{P}$ 表示需要优化的一些值。 $M^{-1}$ 表示在 $M inim u m$ $S na p$ 当中的 $A^{-1}M$ 。 $C$ 是类似的。将上面的 $\eta$ 带入 $M inim u m$ $S na p$ 的顺滑性目标函数，即可得到以下表达式。
顺滑性的目标函数：
$f_{s}=\left[\begin{array}{l} \mathbf{d}_{F} \\ \mathbf{d}_{P} \end{array}\right]^{T} \mathbf{C}^{T} \mathbf{M}^{-T} \mathbf{Q} \mathbf{M}^{-1} \mathbf{C}\left[\begin{array}{l} \mathbf{d}_{F} \\ \mathbf{d}_{P} \end{array}\right]$
把 $\mathbf{C}^{T} \mathbf{M}^{-T} \mathbf{Q} \mathbf{M}^{-1} \mathbf{C}$ 记作 $R$ 矩阵，如下。
$f_{s}=\left[\begin{array}{l} \mathbf{d}_{F} \\ \mathbf{d}_{P} \end{array}\right]^{T}\left[\begin{array}{ll} \mathbf{R}_{F F} & \mathbf{R}_{F P} \\ \mathbf{R}_{P F} & \mathbf{R}_{P P} \end{array}\right]\left[\begin{array}{l} \mathbf{d}_{F} \\ \mathbf{d}_{P} \end{array}\right]$
$R$ 阵通过 $d_F、d_P$ 的下标被分为四块，分界的地方分为四块。之后对上述表达式进行求导处理，对 $d_{{p}_{\eta}}$ 进行求导， $\eta$ 表示的是维度，因为在 $x 、 y 、 z$ 三个方向都是用分段的多项式进行表示的，所以三个方向就得考虑 $d_{{p}_{x}}、d_{{p}_{y}}、d_{{p}_{z}}$ ，就可以得出一个通式，如下方最后一行的式子，主要是为了简化符号，表示对一个轴的计算：
$\begin{aligned} &\mathbf{J}_{s}=\left[\frac{\partial f_{s}}{\partial \mathbf{d}_{P_{x}}}, \frac{\partial f_{s}}{\partial \mathbf{d}_{P_{y}}}, \frac{\partial f_{s}}{\partial \mathbf{d}_{P_{z}}}\right], \mathbf{H}_{s}=\left[\frac{\partial^{2} f_{s}}{\partial \mathbf{d}_{P_{x}}^{2}}, \frac{\partial^{2} f_{s}}{\partial \mathbf{d}_{P_{y}}^{2}}, \frac{\partial^{2} f_{s}}{\partial \mathbf{d}_{P_{z}}^{2}}\right], \\ &\frac{\partial f_{s}}{\partial \mathbf{d}_{P_{\mu}}}=2 \mathbf{d}_{F}^{T} \mathbf{R}_{F P}+2 \mathbf{d}_{P}^{T} \mathbf{R}_{P P}, \quad \frac{\partial^{2} f_{s}}{\partial \mathbf{d}_{P \mu}^{2}}=2 \mathbf{R}_{P P}^{T}, \end{aligned}$
这就是一个对矩阵的求导，想象成数的求导就行。
得到导数后，因为是凸函数，可以得到最优解，因为此时又考虑了碰撞的代价函数以及速度和加速度的代价函数，所以现在考虑顺滑性的代价函数所得到的最优解并不一定是全局的最优解。所以接下来考虑碰撞的目标函数。

1.3 碰撞目标函数的构建及其梯度

因为接下来的速度与加速度目标函数的构建与碰撞的目标函数构建方法大同小异，所以只列举碰撞目标函数的构建方法。

引入 $P e na lt y$ $F u n c t i o n$ ，当 $U A V$ 距离障碍物很近的时候，将这个函数值设置的非常大，使得 $U A V$ 远离这个障碍物；但是当 $U A V$ 出于一个非常安全的情况下，就把这个函数值设置的小一点，以便快速通过空旷区域。
惩罚函数是可微的，可以选择如下式子所示的指数函数： $c(d)=\alpha \cdot \exp \left(-\left(d-d_{0}\right) / r\right)$ $d_0$ 表示的是一个安全距离， $d$ 表示的是无人机当前在一个位置（与障碍物之间的距离），假如这个 $d$ 非常接近障碍物了，所以此时的 $d$ 肯定是要小于安全距离 $d_0$ 的，所以 $d-d_0$ 就是一个负数，则 $d-d_0)$ 就是一个正数，而 $r$ 是个系数可以自定的，假设 $r = 0.1$ ，此时的这个指数 $e x p$ 的数值就会很大，所以整个惩罚函数的值就会非常大，这样就使得无人机会远离障碍物，其实基于软约束的这种方法和人工势场法的思想会不会有点类似？
轨迹是一条曲线，轨迹上的点都必须去计算这个惩罚函数。每个点都考虑的话就差不多是个线积分，就沿着轨迹 $d_s$ 进行积分，积分其实就是个累加的想法，把每个点加起来，因为是 $d_s$ 积分，所以可以用每一小段的速度乘以时间 $d_t$ 进行代替 $d_s$ ，这个速度 $v (t)$ 要注意一下，这是 $x 、 y 、 z$ 三个方向的速度合并后的一个速度，也就是无人机真实的速度。 $\begin{aligned} f_{o} &=\int_{T_{0}}^{T_{M}} c(p(t)) d s \\ &=\int_{T_{0}}^{T_{M}} c(p(t))\|v(t)\| d t=\sum_{k=0}^{\tau / \delta t} c\left(p\left(\mathcal{T}_{k}\right)\right)\|v(t)\| \delta t \end{aligned}$
其中 $\|v(t)\| = \sqrt{(v_x)^2 + (v_y)^2 + (v_z)^2}$ 。
上述式子因为没有一个理论的表达式，所以进行离散化处理。
求导，过程类似顺滑性约束的目标函数求导，对三个方向分别求导，通式为对 $d_{{p}_{\mu}}$ 求导的式子，因为三个轴的求法都是一样的。
$\begin{aligned} &\mathbf{J}_{o}=\left[\frac{\partial f_{o}}{\partial \mathbf{d}_{P_{x}}}, \frac{\partial f_{o}}{\partial \mathbf{d}_{P_{y}}}, \frac{\partial f_{o}}{\partial \mathbf{d}_{P_{z}}}\right] \\ &\frac{\partial f_{o}}{\partial \mathbf{d}_{P_{\mu}}}=\sum_{k=0}^{\tau / \delta t}\left\{\nabla_{\mu} c\left(p\left(\mathcal{T}_{k}\right)\right)\|v\| \mathbf{F}+c\left(p\left(\mathcal{T}_{k}\right)\right) \frac{v_{\mu}}{\|v\|} \mathbf{G}\right\} \delta t,(9) \end{aligned}$
对 $c\left(p\left(\mathcal{T}_{k}\right)\right)\|v(t)\| \delta t$ 这部分进行求导，可以使用乘法求导的法则，即 $c\left(p\left(\mathcal{T}_{k}\right)\right)$ 的导数乘以 $\|v(t)\|$ 再加上 $c\left(p\left(\mathcal{T}_{k}\right)\right)$ 乘以 $\|v(t)\|$ 的导数。上方求导后的 $\mathbf{F}$ 就是对第一项求导后所产生的项， $\mathbf{G}$ 就是对第二项求导后产生的项。 $\left(p\left(\mathcal{T}_{k}\right)\right)$ 就是 $\eta*\mathbf{T}$ 得来的。 $\eta=\mathbf{M}^{-1}\mathbf{C}\left[\begin{array}{l}\mathbf{d}_{F} \\\mathbf{d}_{P}\end{array}\right]$ ，现在引进一个新的符号 $L_{dp}$ 来指代 $\eta$ 当中对 $d_p$ 求导后的项，所以可以得到 $\mathbf{F} = \mathbf{T}\mathbf{L}_{dp}$ ， $\mathbf{G} = \mathbf{T}\mathbf{V}_{m}\mathbf{L}_{dp}$ 。然后对速度求导的时候，因为有根号，所以套用有根号的函数求导公式。 $\nabla_{\mu}$ 就是碰撞代价在某个轴（ $x 、 y 、 z$ ）上的梯度。
软约束优化中还得到了 $Hess ian$ 矩阵（一阶导数再求导），了解即可如下： $\begin{aligned} &\mathbf{H}_o=\left[\frac{\partial^2 f_o}{\partial \mathbf{d}_{P_x}^2}, \frac{\partial^2 f_o}{\partial \mathbf{d}_{P_y}^2}, \frac{\partial^2 f_o}{\partial \mathbf{d}_{P_z}^2}\right] \\ &\frac{\partial^2 f_o}{\partial \mathbf{d}_{P \mu}^2}=\sum_{k=0}^{\tau / \delta t}\left\{\mathbf { F } ^ { T } \nabla _ { \mu } c \left(p\left(\mathcal{T}_k\right) \frac{v_\mu}{\|v\|} \mathbf{G}+\mathbf{F}^T \nabla_\mu^2 c\left(p\left(\mathcal{T}_k\right)\right)\|v\| \mathbf{F}\right.\right. \\ &\left.+\mathbf{G}^T \nabla_\mu c\left(p\left(\mathcal{T}_k\right)\right) \frac{v_\mu}{\|v\|} \mathbf{F}+\mathbf{G}^T c\left(p\left(\mathcal{T}_k\right)\right) \frac{v_\mu^2}{\|v\|^3} \mathbf{G}\right\} \delta t \end{aligned}$
其他的速度约束与加速度约束差不多构建，就不细说了。
这样就有了三部分的雅克比矩阵了， $\mathbf{J}=\lambda_1 \mathbf{J}_s+\lambda_2 \mathbf{J}_o+\lambda_3\left(\mathbf{J}_v+\mathbf{J}_a\right)$ ， $\mathbf{H}=\lambda_1 \mathbf{H}_s+\lambda_2 \mathbf{H}_o+\lambda_3\left(\mathbf{H}_v+\mathbf{H}_a\right)$ ，以上就是碰撞速度加速度目标函数及其梯度的构建步骤。