稠密环境下编队飞行的分布式群轨迹优化（二）

向上的Stone

已于 2023-12-27 13:27:05 修改

阅读量638

点赞数 15

分类专栏：论文阅读笔记文章标签：无人机

于 2023-12-27 12:44:51 首次发布

本文链接：https://blog.csdn.net/aidimoli123/article/details/135233425

版权

论文阅读笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

稠密环境下编队飞行的分布式群轨迹优化（二）

原文章题目：Distributed Swarm Trajectory Optimization for Formation Flight in
Dense Environments
作者：Lun Quan, Longji Yin, Chao Xu, and Fei Gao
出处：2022 International Conference on Robotics and Automation (ICRA)
原文下载链接：点击下载
背景介绍部分在这里：稠密环境下编队飞行的分布式群轨迹优化（一）
实验部分介绍在这里：稠密环境下编队飞行的分布式集群轨迹优化（三）

三、微分编队相似性指标

$N$ 个机器人的编队由无向图 ${\cal G} = ({\cal V},{\cal E})$ 建模，其中 ${\cal V} = \{ 1,2,...,N\}$ 是顶点集, ${\cal E} \subset {\cal V} \times {\cal V}$ 是边缘。在图 ${\cal G}$ 中，顶点 $i$ 代表位置向量 ${{\bf{p}}_i} = [{x_i},{y_i},{z_i}] \in {^3}$ 的第 ${i^{th}}$ 个机器人。连接顶点 $\in {\cal V}$ 和顶点 $\in {\cal V}$ 的边 ${e_{ij}} \in {\cal E}$ 意味着机器人 $i$ 和 $j$ 可以测量彼此之间的几何距离。在我们的工作中，每个机器人都与所有其他机器人进行通信，因此形成图 ${\cal G}$ 是完整的。图 ${\cal G}$ 的每条边都与一个非负数作为权重相关联。在这项工作中,边 ${e_{ij}}$ 的权重由下式给出:
${w_{ij}} = {\left\| {{{\bf{p}}_i} - {{\bf{p}}_j}} \right\|^2},\quad (i,j) \in {\cal E},（1）$
其中 $\parallel \cdot \parallel$ 表示欧几里德范数。现在确定了编队图 ${\cal G}$ 的邻接矩阵 ${\bf{A}} \in \Bbb R {^{N \times N}}$ 和度矩阵 ${\bf{D}} \in \Bbb R{^{N \times N}}$ 。因此，相应的拉普拉斯矩阵由下式给出：
${\bf{L}} = {\bf{D}} - {\bf{A}}.（2）$
利用上述矩阵，图 ${\cal G}$ 的对称归一化拉普拉斯矩阵定义为
$\widehat {\bf{L}} = {{\bf{D}}^{ - 1/2}}{\bf{L}}{{\bf{D}}^{ - 1/2}} = {\bf{I}} - {{\bf{D}}^{ - 1/2}}{\bf{A}}{{\bf{D}}^{ - 1/2}},（3）$
其中 ${\bf{I}} \in \Bbb R{^{N \times N}}$ 是单位矩阵。
作为图表示矩阵，拉普拉斯包含有关图结构的信息[25]。为了实现所需的群体形成，我们提出了一种形成相似距离度量：
$\left\| {\widehat {\bf{L}} - {{\widehat {\bf{L}}}_{des}}} \right\|_F^2 = {\mathop{\rm tr}\nolimits} \left\{ {{{\left( {\widehat {\bf{L}} - {{\widehat {\bf{L}}}_{{\rm{des }}}}} \right)}^T}\left( {\widehat {\bf{L}} - {{\widehat {\bf{L}}}_{{\rm{des }}}}} \right)} \right\},（4）$
其中 $tr\{ \cdot \}$ 表示矩阵的迹， $\widehat {\bf{L}}$ 是当前群体编队的对称归一化拉普拉斯算子, ${\widehat {\bf{L}}_{{\rm{des }}}}$ 是期望编队的对应项。弗罗贝尼乌斯范数 $\parallel \cdot {\parallel _F}$ 用于我们的距离度量。 $f$ 对于编队的平移和旋转本身是不变的，因为相应的图形是由机器人位置之间的绝对距离加权的。缩放不变性是通过公式（3）中的度矩阵对图拉普拉斯算子进行归一化来实现的。
我们的度量对于每个机器人的位置在分析上是可微的。对于机器人 $i$ ，我们使用其 $n$ 个相邻边的权重 ${ {e_{i1}},{e_{i2}},...,,{e_{in}}\}$ 形成权重向量 ${{\bf{w}}_i} = {[{w_{i1}},{w_{i2}},...,,{w_{in}}]^T}$ 。根据链式求导法则， $f$ 相对于的梯度 ${{\bf{p}}_i}$ 可写为
${{\bf{w}}_i} = {[{w_{i1}},{w_{i2}},...,,{w_{in}}]^T}（5）$
根据我们的度量（4）， $f$ 相对于每个权重 ${w_{ij}}$ 的梯度可以计算如下
$\frac{{\partial f}}{{\partial {w_{ij}}}} = tr\{ {(\frac{{\partial f}}{{\partial {\bf{\hat L}}}})^T}(\frac{{\partial {\bf{\hat L}}}}{{\partial {w_{ij}}}})\} ,（6）$
其中
$\frac{{\partial f}}{{\partial {\bf{\hat L}}}} = \frac{{\partial ||{\bf{\hat L}} - {{{\bf{\hat L}}}_{des}}||_F^2}}{{\partial {\bf{\hat L}}}} = 2({\bf{\hat L}} - {{\bf{\hat L}}_{des}}),（7）$
$\frac{{\partial {\bf{\hat L}}}}{{\partial {w_{ij}}}} = - \frac{{\partial ({{\bf{D}}^{ - 1/2}}{\bf{A}}{{\bf{D}}^{ - 1/2}})}}{{\partial {w_{ij}}}}. （8）$
那么梯度 $\partial f/\partial {{\bf{w}}_i}$ 可以写为
$\partial f/\partial {{\bf{w}}_i} = {[\partial f/\partial {w_{i1}},\partial f/\partial {w_{i2}},...,\partial f/\partial {w_{in}}]^T}.（9）$
对于 $\partial {{\bf{w}}_i}/\partial {{\bf{p}}_i}$ ，由于权重函数(1)是可微的，因此可以很容易地导出雅可比行列式。图2显示了正方形编队的度量和梯度的轮廓。
在这里插入图片描述

四、编队飞行时空轨迹优化

A.轨迹表示

在这项工作中，我们采用文献[26]中MINCO表示。这是一种最小控制工作量的多项式轨迹类，用于对平坦输出轨迹进行时空变形。
${\Xi _{MINCO}} = \{ p(t):[0,{T_\Sigma }] \mapsto \Bbb R {^m}|{\bf{c}} = C({\bf{q}},{\bf{T}}),{\bf{q}} \in \Bbb R {^{m(M - 1)}},{\bf{T}} \in \Bbb R _{ > 0}^M\} , （10）$
其中， ${\bf{c}} = {(c_1^T, \cdots ,c_M^T)^T}$ 为多项式系数， ${\bf{q}} = ({q_1}, \cdots ,{q_{M - 1}})$ 中间点, ${\bf{T}} = {({T_1}, \cdots ,{T_M})^T}$ 时间向量， $C({\bf{q}},{\bf{T}})$ 是根据文献[26]中的定理2构造的参数映射, ${T_\Sigma } = \sum \limits_M^{i = 1} {T_i}$ 是总时间。
$n$ 维 $M$ 段轨迹 $p (t)$ 定义为：
${p_i}(t - {t_{i - 1}}),\quad \forall t \in [{t_{i - 1}},{t_i}),（11）$
第 ${i^{th}}$ 块轨迹由5次多项式（即 $N = 5$ ）表示
${p_i}(t) = c_i^T\beta (t),\quad \forall t \in [0,{T_i}],（12）$
其中， ${c_i} \in {\Bbb R^{6 \times m}}$ 是系数矩阵， $\beta (t) = {[1,t,...,{t^{\rm{N}}}]^T}$ 是自然基， ${T_i} = {t_i} - {t_{i - 1}}$ 是第 ${i^{th}}$ 块的时间分配。
MINCO由 $({\bf{q}},{\bf{T}})$ 唯一确定。并且参数 ${\bf{c}} = C({\bf{q}},{\bf{T}})$ 映射以线性时间和空间复杂度将轨迹表示 $({\bf{c}},{\bf{T}})$ 转换为 $({\bf{q}},{\bf{T}})$ ，这使得任何二阶连续成本函数 $J({\bf{c}},{\bf{T}})$ 用 $\tilde J({\bf{q}},{\bf{T}})$ 表示。因此，可以分别通过 $\partial \tilde J/\partial {\bf{q}}$ 和 $\partial \tilde J/\partial {\bf{T}}$ 求得 $\partial J/\partial {\bf{c}}$ 和 $\partial J/\partial {\bf{T}}$ 。
特别是，为了处理时间积分约束 $\psi (p(t), \cdots ,{p^{(3)}}(t))\underline \prec {\bf{0}}$ ，例如避免碰撞和动力学可行性，我们将它们转换为有限维约束 $\psi ({\hat p_{i,j}})$ 通过对轨迹上的约束点 ${\hat p_{i,j}} = {p_i}((j/{\kappa _i}) \cdot {T_i})$ 进行采样，其中 ${\kappa _i}$ 是第 ${i^{th}}$ 块上的采样点。

B.优化问题的构建

我们将编队飞行的轨迹生成公式化为无约束优化问题：
$\mathop {\min }\limits_{{\bf{c}},{\bf{T}}} \left[ {{J_e},{J_t},{J_o},{J_f},{J_r},{J_d},{J_u}} \right] \cdot \lambda ,（13）$
其中， $\lambda$ 是权衡每个成本函数的权重向量。
1）平滑度惩罚 ${J_e}$ ：第 ${i^{th}}$ 块轨迹的三阶控制输入及其梯度写为：
${J_e} = \smallint _0^{{T_i}}\parallel p_i^{(3)}(t){\parallel ^2}dt,（14）$
$\frac{{\partial {J_e}}}{{\partial {c_i}}} = 2\left( {\smallint _0^{{T_i}}{\beta ^{(3)}}(t){\beta ^{(3)}}{{(t)}^T}dt} \right){c_i},（15）$
$\frac{{\partial {J_e}}}{{\partial {T_i}}} = c_i^T{\beta ^{(3)}}({T_i}){\beta ^{(3)}}{({T_i})^T}{c_i}.（16）$
2）总时间惩罚 ${J_t}$ ：为了保证轨迹的光滑性，我们最小化总时间 ${J_t} = \sum \limits_M^{i = 1} T$ 。梯度由 $\partial {J_{\rm{t}}}/\partial {\bf{c}} = 0$ 和 $\partial {J_{\rm{t}}}/\partial {\bf{T}} = 1$ 求出。
3）碰撞项惩罚 ${J_o}$ ：受文献[27]的启发，避障惩罚 ${J_o}$ 使用欧几里得符号距离场（ESDF）计算。选取靠近障碍物的约束点：
${\psi _o}({\hat p_{i,j}})= \begin{cases} {{d_{thr}} - d({{\hat p}_{i,j}})}, & \text{if ${d({{\hat p}_{i,j}}) < {d_{thr}}}$}\\ 0,& \text{if ${d({{\hat p}_{i,j}}) \ge {d_{thr}}}$} \end{cases}（17）$
其中, ${d_{thr}}$ 是安全阈值， $d({\hat p_{i,j}})$ 是所考虑的点与其周围最近的障碍物之间的距离。然后通过计算采样约束函数的加权和得到避障惩罚：
${J_o} = \frac{{{T_i}}}{{{\kappa _i}}} \sum \limits_{j = 0}^{{\kappa _i}} {\bar \omega _j}\max {\{ {\psi _o}({\hat p_{i,j}}),0\} ^3},（18）$
其中 $({{\bar \omega }_0},{{\bar \omega }_1}, \cdots ,{{\bar \omega }_{{\kappa _i} - 1}},{{\bar \omega }_{{\kappa _i}}}) = (1/2,1, \cdots ,1,1/2)$ 是遵循梯形规则的正交系数，如文献[28]。
${J_o}$ 相对于 ${c_i}$ 和 $T_i$ 的梯度具体如下：
$\frac{{\partial {J_o}}}{{\partial {c_i}}} = \frac{{\partial {J_o}}}{{\partial {\psi _o}}}\frac{{\partial {\psi _o}}}{{\partial {c_i}}}, （19）$
$\frac{{\partial {J_o}}}{{\partial {T_i}}} = \frac{{{J_o}}}{{{T_i}}} + \frac{{\partial {J_o}}}{{\partial {\psi _o}}}\frac{{\partial {\psi _o}}}{{\partial t}}\frac{{\partial t}}{{\partial {T_i}}},（20）$
$\frac{{\partial t}}{{\partial {T_i}}} = \frac{j}{{{\kappa _i}}},\quad t = \frac{j}{{{\kappa _i}}}{T_i},（21）$
其中， $t$ 是相对时间。对于 $d({\hat p_{i,j}}) < {d_{thr}}$ 的情况，梯度由下式给出
$\frac{{\partial {\psi _o}}}{{\partial {c_i}}} = - \beta (t)\nabla {d^T},\quad \frac{{\partial {\psi _o}}}{{\partial t}} = - \nabla {d^T}\dot p(t),（22）$
其中， $\nabla d$ 是ESDF在 ${\hat p_{i,j}}$ 中的梯度。否则，梯度为 $\partial {\psi _o}/\partial {c_i} = {\bf{0}}, \partial {\psi _o}/\partial t = 0$ 。
4）集群编队惩罚 ${J_f}$ ：在第三节中，我们设计了一个可微分度量来量化群体形成之间的相似距离。在优化中，当前地层与期望地层之间的相似性误差通过 ${\psi _f} = f(p(t),\bigcup\nolimits_\Phi {{p_\phi }(\tau )} )f\left( \cdot \right)$ 来测量，其中 $f\left( \cdot \right)$ 在（4）中详细说明， $\Phi$ 表示集合其他智能体的。
由于 ${J_f}$ 涉及其他智能体的轨迹，因此我们需要处理自身轨迹的相对时间 $j{T_i}/{\kappa _i}$ 和其他智能体轨迹的全局时间戳 $\tau = {T_1} + ... + {T_{i - 1}} + j{T_i}/{\kappa _i}$ 。 ${J_f}$ 考虑任意 $\le l \le i$ 的先前时间，并用公式表示：
${J_f} = \frac{{{T_i}}}{{{\kappa _i}}} \sum \limits_{{\kappa _i}}^{j = 0} {\bar \omega _j}\max {\{ {\psi _f}(p(t),\bigcup\limits_\Phi {{p_\phi }(\tau )} ),0\} ^3}.（23）$
${J_f}$ 相对于 ${c_i}$ 和 ${T_l}$ 的梯度具体如下
$\frac{{\partial {J_f}}}{{\partial {c_i}}} = \frac{{\partial {J_f}}}{{\partial {\psi _f}}}\frac{{\partial {\psi _f}}}{{\partial {c_i}}}, （24）$
$\frac{{\partial {J_f}}}{{\partial {T_l}}} = \frac{{{J_f}}}{{{T_l}}} + \frac{{\partial {J_f}}}{{\partial {\psi _f}}}\frac{{\partial {\psi _f}}}{{\partial {T_l}}}.（25）$
为了求出 $\partial {\psi _f}/\partial {T_l}$ ，需要 ${\psi _f}$ 对 $t$ 和 $\tau$ 进行求导：
$\frac{{\partial {\psi _f}}}{{\partial {T_l}}} = \frac{{\partial {\psi _f}}}{{\partial t}}\frac{{\partial t}}{{\partial {T_l}}} + \frac{{\partial {\psi _f}}}{{\partial \tau }}\frac{{\partial \tau }}{{\partial {T_l}}}, （26）$
$\frac{{\partial t}}{{\partial {T_l}}}= \begin{cases} {\frac{j}{{{\kappa _i}}}}, & \text{if ${l = i,}$}\\ 0,& \text{if ${l < i}$} \end{cases}, \frac{{\partial \tau }}{{\partial {T_l}}}= \begin{cases} {\frac{j}{{{\kappa _i}}}}, & \text{if ${l = i,}$}\\ 0,& \text{if ${l < i}$} \end{cases}（27）$
${\psi _f}$ 相对于 ${c_i}$ 、 $t$ 和 $\tau$ 的梯度由下式给出
$\frac{{\partial {\psi _f}}}{{\partial {c_i}}} = \frac{{\partial {\psi _f}}}{{\partial p(t)}}\frac{{\partial p(t)}}{{\partial {c_i}}}, （28）$
$\frac{{\partial {\psi _f}}}{{\partial t}} = \frac{{\partial {\psi _f}}}{{\partial p(t)}}\frac{{\partial p(t)}}{{\partial t}} = \frac{{\partial {\psi _f}}}{{\partial p(t)}}\dot p(t), （29）$
$\frac{{\partial {\psi _f}}}{{\partial \tau }} = \sum \limits_\Phi \frac{{\partial {\psi _f}}}{{\partial {p_\phi }(\tau )}}\frac{{\partial {p_\phi }(\tau )}}{{\partial \tau }} = \sum \limits_\Phi \frac{{\partial {\psi _f}}}{{\partial {p_\phi }(\tau )}}{\dot p_\phi }(\tau ),（30）$
其中 ${\psi _f}$ 对 $p (t)$ 和 ${p_\phi }(\tau )$ 的梯度见 (5)。
5）集群编队无人机间碰撞惩罚 ${J_r}$ ：我们惩罚在全局时间戳处接近其他智能体轨迹的约束点。因此，群体相互回避的成本函数定义为
${{J_r} = \sum \limits_\Phi \frac{{{T_i}}}{{{\kappa _i}}}\sum \limits_{{\kappa _i}}^{j = 0} {{\bar \omega }_j}\max {{\{ {\psi _{{r_\phi }}}(p(t),\tau ),0\} }^3},}（31）$
${\psi _{{r_\phi }}}(p(t),\tau ) = D_r^2 - d{(p(t),{p_\phi }(\tau ))^2}, （32）$
$d(p(t),{p_\phi }(\tau )) = \parallel p(t) - {p_\phi }(\tau )\parallel , （33）$
其中， $D_r$ 是每个智能体之间的距离。
${J_r}$ 相对于 $c_i$ 和 $T_l$ 的梯度与（24）和（25）相似， $\partial {\psi _{{r_\phi }}}/\partial {T_l}$ 与（26）相同。当 ${\rm{D}}_r^2 \ge d{(p(t),{p_\phi }(\tau ))^2}$ 时， ${\psi _{{r_\phi }}}$ 相对于 $c_i$ 、 $t$ 和 $\tau$ 的梯度为
$\frac{{\partial {\psi _{{r_\phi }}}}}{{\partial {c_i}}} = - 2\beta (t){(p(t) - {p_\phi }(\tau ))^T}, （34）$
$\frac{{\partial {\psi _{{r_\phi }}}}}{{\partial t}} = - 2{(p(t) - {p_\phi }(\tau ))^T}\dot p(t), （35）$
$\frac{{\partial {\psi _{{r_\phi }}}}}{{\partial \tau }} = 2{(p(t) - {p_\phi }(\tau ))^T}{\dot p_\phi }(t).（36）$
6）动力学可行性惩罚 $J_d$ ：我们限制速度、加速度和加加速度的最大值，以保证智能体可以执行轨迹。读者可以参考[15]了解更多详细信息。
7）约束点的均匀分布 $J_u$ ：约束点预计是空间均匀的。不均匀的约束点可能会跳过一些小尺寸的障碍物，这可能会降低最终轨迹的安全性。因此，对均匀分布惩罚 $J_u$ 进行优化，以防止约束点聚集在某些位置。读者可以参考[15]了解更多详细信息。

注

本博客主要是对原文的翻译，对其中的内容细节并没有仔细推敲，翻译难免有误，希望各位看客评论区指出。谢谢！

向上的Stone

关注

15
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
稠密环境下编队飞行的分布式群轨迹优化（二）

对于编队的平移和旋转本身是不变的，因为相应的图形是由机器人位置之间的绝对距离加权的。：约束点预计是空间均匀的。不均匀的约束点可能会跳过一些小尺寸的障碍物，这可能会降低最终轨迹的安全性。：在第三节中，我们设计了一个可微分度量来量化群体形成之间的相似距离。本博客主要是对原文的翻译，对其中的内容细节并没有仔细推敲，翻译难免有误，希望各位看客评论区指出。在我们的工作中，每个机器人都与所有其他机器人进行通信，因此形成图。是所考虑的点与其周围最近的障碍物之间的距离。我们的度量对于每个机器人的位置在分析上是可微的。
复制链接

扫一扫