基于连续隐式 SDF 的任意形状机器人轨迹优化的论文解析

基于连续隐式 SDF 的任意形状机器人轨迹优化

首先这篇文章禁止转载,主要是如果有对这篇论文的不同见解方便反馈,我的邮箱(fanzexuan135@163.com)。
正文开始:这篇论文《Continuous Implicit SDF Based
Any-shape Robot Trajectory Optimization》引起了我极大的兴趣,任意形状可以进行高精度规划(实际规避障碍物的效果非常好,但是轨迹合理性,比如可以走更宽敞的地方避免在窄区域闪转腾挪,包括最优性应该也还有优化空间,当然这不是本论文的重点),下面我对这篇论文的理论和不好理解的地方做下个人理解的阐述。
My github: https://github.com/fanzexuan

1. 引言

在机器人的运动规划中,常用的几何表示和计算方法包括:

  1. 用简单几何体(如椭球体、多面体等)近似机器人的形状。这种方法精度不高,导致规划出的轨迹过于保守。
  2. 用采样点云表示机器人的表面。这种方法受限于采样密度,在低分辨率下可能遗漏碰撞,高分辨率下表示又过于复杂。

对于环境表示,优化类的轨迹规划方法通常需要预先计算并存储环境的 SDF(signed distance field)或安全通道等信息,这带来了额外的计算和存储开销。

总结现有方法存在两个问题:

  1. 很难高效准确地对任意形状的机器人建模;
  2. 轨迹优化需要环境的额外信息如 SDF 等。

本文的关键思想是:任意机器人的表面可以用其 SDF 的零等值面隐式表示。基于此,作者进一步利用一个隐函数来简化的计算机器人沿轨迹扫出体积(swept volume)的 SDF。通过利用时空连续性,该计算是高效的,并且隐式表示保证了对任意形状机器人的精确连续碰撞检测。此外,作者还提出了一个基于隐式 SDF 的轨迹优化方法。

2. 机器人的隐式 SDF 表示

作者用一个隐式连续函数 S D F B : R 3 → R SDF_B: \mathbb{R}^3 \to \mathbb{R} SDFB:R3R 来表示任意形状的机器人 B B B,该函数在机器人内部为负值。三角网格是表示任意形状的通用成熟方法。文中用 winding number signed distance field [20] 来实现隐式 SDF。利用现有算法和库如 LIBIGL,可以高效地计算任意查询点 x \boldsymbol{x} x 处的 S D F B ( x ) SDF_B(\boldsymbol{x}) SDFB(x) 值及其梯度 ∇ S D F B ∣ x \nabla SDF_B|_{\boldsymbol{x}} SDFBx

3. 扫出体积的隐式 SDF 表示

随着机器人运动,其 SDF 变成时变函数:

f s d f ( x o b , t ) = S D F B ( t ) ( x o b ) = S D F R ( t ) B + p ( t ) ( x o b ) f_{sdf}(\boldsymbol{x}_{ob}, t) = SDF_{B(t)}(\boldsymbol{x}_{ob}) = SDF_{R(t)B+\boldsymbol{p}(t)}(\boldsymbol{x}_{ob}) fsdf(xob,t)=SDFB(t)(xob)=SDFR(t)B+p(t)(xob)

根据运动的相对性,该函数可改写为:

f s d f ( x o b , t ) = S D F B ( R − 1 ( t ) ( x o b − p ( t ) ) ) f_{sdf}(\boldsymbol{x}_{ob}, t) = SDF_B\big(R^{-1}(t)(\boldsymbol{x}_{ob}-\boldsymbol{p}(t))\big) fsdf(xob,t)=SDFB(R1(t)(xobp(t)))

其中 R ( t ) , p ( t ) R(t), \boldsymbol{p}(t) R(t),p(t) 分别是机器人的姿态和位置。

直观上,对任意查询点 x o b \boldsymbol{x}_{ob} xob,如果 f s d f ( x o b , t ) f_{sdf}(\boldsymbol{x}_{ob}, t) fsdf(xob,t) 在时域上取最小值,对应的时刻 t ∗ t^* t 就是 x o b \boldsymbol{x}_{ob} xob 到扫出体积(swept volume)的距离。假设 p ( t ) , R ( t ) \boldsymbol{p}(t), R(t) p(t),R(t) 连续,则 f s d f ( x o b , t ) f_{sdf}(\boldsymbol{x}_{ob}, t) fsdf(xob,t) 在时空上连续,最小值 f s d f ∗ f^*_{sdf} fsdf 容易通过数值方法求得。

4. 基于时空连续的高效 SDF 计算

文中利用梯度下降和 Armijo 线搜索来计算 t ∗ = arg ⁡ min ⁡ t f s d f ( x o b , t ) t^* = \arg\min_t f_{sdf}(\boldsymbol{x}_{ob}, t) t=argmintfsdf(xob,t)。收敛速度取决于初值选择。作者在轨迹上均匀采样,找到 x o b \boldsymbol{x}_{ob} xob 到采样机器人位置的最近点作为 t i n i t t_{init} tinit。对于 x o b \boldsymbol{x}_{ob} xob 附近的其他查询点,则用 x o b \boldsymbol{x}_{ob} xob t ∗ t^* t 值初始化,加速了计算。每次查询只需微秒级时间。

5. 基于优化的轨迹生成

以四旋翼无人机为例,其微分平坦性使得姿态轨迹可由位置轨迹唯一确定,降低了优化问题的维度。作者采用了一种最小控制力多项式(MINCO)的轨迹表示方法(MINCO是浙大这个课题组自己使用的一种模型定义,可以看浙大FAST实验室发表的相关论文)。

将轨迹生成构建为一个无约束优化问题:

min ⁡ c , T λ s J s + λ m J m + λ d J d + ρ J t \min_{\boldsymbol{c}, \boldsymbol{T}} \quad \lambda_s J_s + \lambda_m J_m + \lambda_d J_d + \rho J_t c,TminλsJs+λmJm+λdJd+ρJt

其中 J s , J m , J d , J t J_s, J_m, J_d, J_t Js,Jm,Jd,Jt 分别是安全性、平滑性、动力学可行性和总时间代价项。

传统方法中安全项 J s J_s Js 通常是沿轨迹积分得到:

J s = ∫ t m i n t m a x J s ( c , T , t )   d t J_s = \int_{t_{min}}^{t_{max}} J_s(\boldsymbol{c}, \boldsymbol{T}, t) \, dt Js=tmintmaxJs(c,T,t)dt

由于本文没有 f s d f f_{sdf} fsdf 的解析形式,直接积分存在遗漏碰撞的风险,且在稀疏环境中许多采样点是冗余的。相比之下,该论文的方法无需沿轨迹采样,只需对障碍物点求 f s d f ∗ f^*_{sdf} fsdf,理论上避免了这些问题,效率也更高。

此外,文章还给出了各项的梯度解析形式,并提出了一种隐式求解 t ∗ t^* t 对各优化变量梯度的方法。

小结

本文利用隐函数将机器人和其轨迹扫出体积统一表示,基于时空连续性快速计算任意点到 swept volume 的距离,用于构建优化问题。该方法适用于任意形状的机器人,可实现精确连续避障。

代码事例(非完整)

# 加载机器人表面三角网格
V, F = load_mesh("robot.obj") 

# 定义 MINCO 轨迹
p = MINCO_traj(q, T) 

# 隐式 SDF 查询函数
def query_f_sdf(x_ob, t):
    R, p = p.rotation(t), p.translation(t)
    return signed_distance(V, F, np.dot(R.T, x_ob - p))

def swept_volume_sdf(x_ob):  
    t_min, t_max = 0, p.duration
    t_star = scipy.optimize.minimize(lambda t: query_f_sdf(x_ob, t), 
                                     x0=t_init, bounds=[(t_min, t_max)]).x
    f_star_sdf = query_f_sdf(x_ob, t_star)
    return f_star_sdf, t_star

# 构建优化问题
def optimize(q_init, T_init):
    q, T = q_init, T_init
    for i in range(max_iters):
        J_s, gradq_J_s, gradT_J_s = eval_safety_cost(q, T)  
        J_m, gradq_J_m, gradT_J_m = eval_smooth_cost(q, T)
        ...
        
        # 求各代价项梯度,用于更新 q, T
        gradq_J = λ_s*gradq_J_s + λ_m*gradq_J_m + ...
        gradT_J = λ_s*gradT_J_s + λ_m*gradT_J_m + ...        
        q = q - lr * gradq_J
        T = T - lr * gradT_J

关键是隐式 SDF 的查询函数 swept_volume_sdf。它只需要机器人表面三角网格的顶点 V 和拓扑 F 信息。通过数值优化找到任意 x o b \boldsymbol{x}_{ob} xob 处的 t ∗ t^* t 值,代入 query_f_sdf 即可得到 f s d f ∗ f^*_{sdf} fsdf

这种隐式表示使得该方法与具体的机器人形状无关,可以灵活应用于各种机器人。同时基于时空连续性的快速 SDF 计算,也为优化问题提供了精确、连续的碰撞约束信息。该方法为任意形状机器人的轨迹优化提供了一个统一、高效的框架。

Q&A:

1.隐函数(Implicit Function) 与 KKT条件

在数学中,隐函数(Implicit Function)是指一个多元函数f(x1,x2,…,xn)=0所定义的函数关系,其中任一变量都没有被显式表示为其他变量的函数。这与显函数(Explicit Function)相对,后者给出了因变量与自变量之间的显式表达式如y=f(x)。

本文中使用隐式表示有以下几个原因:

  1. 通用性:机器人的形状千变万化,用显式函数(如球、椭球、多面体等)很难统一描述。而隐函数可以灵活表示任意形状的零等值面。例如球面可以用隐式表示 f ( x , y , z ) = x 2 + y 2 + z 2 − R 2 = 0 f(x,y,z)=x^2+y^2+z^2-R^2=0 f(x,y,z)=x2+y2+z2R2=0,而不必用显式的参数方程。

  2. 封闭性:机器人为封闭的物体,其内外可用SDF的正负符号区分。隐式SDF函数自然满足这一性质。若机器人表面为 f ( x , y , z ) = 0 f(x,y,z)=0 f(x,y,z)=0,则可定义其SDF为 S D F ( x , y , z ) = { − d ( ( x , y , z ) , ∂ B ) , ( x , y , z ) ∈ B ∘ 0 , ( x , y , z ) ∈ ∂ B + d ( ( x , y , z ) , ∂ B ) , ( x , y , z ) ∈ R 3 ∖ B SDF(x,y,z)=\begin{cases} -d((x,y,z),\partial B), & (x,y,z)\in B^{\circ} \\ 0, & (x,y,z)\in \partial B \\ +d((x,y,z),\partial B), & (x,y,z)\in \mathbb{R}^3\setminus B \end{cases} SDF(x,y,z)= d((x,y,z),B),0,+d((x,y,z),B),(x,y,z)B(x,y,z)B(x,y,z)R3B ,其中 B , ∂ B , B ∘ B, \partial B, B^{\circ} B,B,B 分别为机器人、表面和内部, d d d 为欧氏距离。

  3. 连续性:本文利用机器人SDF关于时空的连续性,高效计算轨迹扫出体积的SDF。对于连续运动,SDF在时空上也是连续变化的,这保证了数值方法的可行性。显式表示则可能在某些奇异位置不连续。

此外,隐式表示也便于求解SDF的梯度。例如对隐函数 f ( x , y , z ) = 0 f(x,y,z)=0 f(x,y,z)=0 求SDF实际是一个有约束优化问题:

min ⁡ ( x , y , z ) ( x − x 0 ) 2 + ( y − y 0 ) 2 + ( z − z 0 ) 2 s . t . f ( x , y , z ) = 0 \min_{(x,y,z)} \sqrt{(x-x_0)^2+(y-y_0)^2+(z-z_0)^2} \quad s.t. \quad f(x,y,z)=0 (x,y,z)min(xx0)2+(yy0)2+(zz0)2 s.t.f(x,y,z)=0

其KKT条件给出了解析梯度(省略约束违反项):

∇ S D F ( x 0 , y 0 , z 0 ) = ( x ∗ − x 0 , y ∗ − y 0 , z ∗ − z 0 ) ( x ∗ − x 0 ) 2 + ( y ∗ − y 0 ) 2 + ( z ∗ − z 0 ) 2 \nabla SDF(x_0,y_0,z_0) = \frac{(x^*-x_0,y^*-y_0,z^*-z_0)}{\sqrt{(x^*-x_0)^2+(y^*-y_0)^2+(z^*-z_0)^2}} SDF(x0,y0,z0)=(xx0)2+(yy0)2+(zz0)2 (xx0,yy0,zz0)

其中 ( x ∗ , y ∗ , z ∗ ) (x^*,y^*,z^*) (x,y,z) 是最近点,可用数值方法求得。

综上,隐式SDF能以统一的方式连续表示任意形状,并便于梯度求解,是一种强大的几何表示。将其引入轨迹优化领域,可以提高规划的通用性和鲁棒性。本文很好地体现了这一点。

KKT条件,全称Karush-Kuhn-Tucker条件,是非线性规划中一个重要的最优性条件。它给出了一个约束优化问题的最优解所必须满足的一阶必要条件。在满足一定的规则性条件下,KKT条件也是充分条件。

考虑以下的约束优化问题:

min ⁡ x f ( x ) s.t. g i ( x ) ≤ 0 , i = 1 , … , m h j ( x ) = 0 , j = 1 , … , p \begin{aligned} \min_{x} \quad & f(x) \\ \text{s.t.} \quad & g_i(x) \leq 0, \quad i=1,\ldots,m \\ & h_j(x) = 0, \quad j=1,\ldots,p \end{aligned} xmins.t.f(x)gi(x)0,i=1,,mhj(x)=0,j=1,,p

其中 f ( x ) f(x) f(x)是目标函数, g i ( x ) g_i(x) gi(x)是不等式约束, h j ( x ) h_j(x) hj(x)是等式约束。假设这些函数都是连续可微的。

x ∗ x^* x是此问题的一个局部最优解,则在 x ∗ x^* x点处,存在常数 μ i ∗ ≥ 0 \mu_i^* \geq 0 μi0 λ j ∗ \lambda_j^* λj,使得以下条件成立:

  1. Stationarity: ∇ f ( x ∗ ) + ∑ i = 1 m μ i ∗ ∇ g i ( x ∗ ) + ∑ j = 1 p λ j ∗ ∇ h j ( x ∗ ) = 0 \nabla f(x^*) + \sum_{i=1}^{m} \mu_i^* \nabla g_i(x^*) + \sum_{j=1}^{p} \lambda_j^* \nabla h_j(x^*) = 0 f(x)+i=1mμigi(x)+j=1pλjhj(x)=0
  2. Primal feasibility: g i ( x ∗ ) ≤ 0 , i = 1 , … , m ; h j ( x ∗ ) = 0 , j = 1 , … , p g_i(x^*) \leq 0, \quad i=1,\ldots,m; \quad h_j(x^*) = 0, \quad j=1,\ldots,p gi(x)0,i=1,,m;hj(x)=0,j=1,,p
  3. Dual feasibility: μ i ∗ ≥ 0 , i = 1 , … , m \mu_i^* \geq 0, \quad i=1,\ldots,m μi0,i=1,,m
  4. Complementary slackness: μ i ∗ g i ( x ∗ ) = 0 , i = 1 , … , m \mu_i^* g_i(x^*) = 0, \quad i=1,\ldots,m μigi(x)=0,i=1,,m

这里 μ i ∗ \mu_i^* μi λ j ∗ \lambda_j^* λj被称为KKT乘子或拉格朗日乘子。它们的物理意义是最优点处约束对目标函数的敏感度。

KKT条件的重要性在于:

  1. 它将约束优化问题转化为一个等式方程组,便于数值求解。很多优化算法如SQP、内点法等都是基于KKT条件设计的。
  2. 它给出了最优解处目标函数和约束的梯度之间的关系,有助于敏感度分析和优化问题的构建。
  3. 对偶可行性条件揭示了原问题与对偶问题之间的联系,这是凸优化中的重要理论。

在本文中,作者利用KKT条件巧妙地推导出了隐式表面SDF的解析梯度公式,避免了数值微分的昂贵开销。这充分体现了KKT条件作为优化理论在实际问题中的有力应用。优化在机器人领域中无处不在,KKT条件可以说是优化的基石,值得每一位机器人研究者深入理解和掌握。

基于时空连续的高效 SDF 计算是本文的一个核心内容,目的是快速计算任意查询点到机器人轨迹扫掠体积(swept volume)的 SDF。这个过程可以分为两步:

  1. 对于查询点 x o b \boldsymbol{x}_{ob} xob,找到其对应的最近时刻 t ∗ t^* t,即 f s d f ( x o b , t ) f_{sdf}(\boldsymbol{x}_{ob}, t) fsdf(xob,t) 取最小值时的 t t t
  2. t ∗ t^* t 代入 f s d f ( x o b , t ∗ ) f_{sdf}(\boldsymbol{x}_{ob}, t^*) fsdf(xob,t) 得到 x o b \boldsymbol{x}_{ob} xob 到 swept volume 的 SDF 值 f s d f ∗ f^*_{sdf} fsdf

第一步是一个单变量无约束优化问题:

t ∗ = arg ⁡ min ⁡ t f s d f ( x o b , t ) t^* = \arg\min_t f_{sdf}(\boldsymbol{x}_{ob}, t) t=argtminfsdf(xob,t)

为了高效求解,文中使用了梯度下降法,并用 Armijo 线搜索来确定步长。下面详细解释这两个方法:

梯度下降法

梯度下降法是一种一阶优化算法,通过不断沿负梯度方向更新变量以达到最小值点。对于上述问题,迭代公式为:

t k + 1 = t k − α k ∇ t f s d f ( x o b , t k ) t_{k+1} = t_k - \alpha_k \nabla_t f_{sdf}(\boldsymbol{x}_{ob}, t_k) tk+1=tkαktfsdf(xob,tk)

其中 α k \alpha_k αk 是第 k k k 步的步长,通常由线搜索确定。 ∇ t f s d f \nabla_t f_{sdf} tfsdf f s d f f_{sdf} fsdf 关于 t t t 的梯度,文中给出了它的解析表达式(这里不再赘述)。

梯度下降法简单有效,但可能收敛到局部最优。为了得到全局最优,文中使用了多点初始化策略:

  • 在轨迹上均匀采样,找到 x o b \boldsymbol{x}_{ob} xob 在采样时刻的最近点,作为 t t t 的初值 t i n i t t_{init} tinit
  • 对于 x o b \boldsymbol{x}_{ob} xob 附近的查询点,用已计算出的 t ∗ t^* t 值作为初值。

这样可以提高全局收敛性,又利用了 t ∗ t^* t 在空间上的连续性来加速计算。

Armijo 线搜索

在梯度下降中,步长 α k \alpha_k αk 的选择至关重要。太小会导致收敛缓慢,太大则可能越过最小值点。Armijo 线搜索是一种自适应步长策略,它以保证函数充分下降为目标,从一个初始步长(比如1)开始,不断缩小步长直到满足 Armijo 条件:

f s d f ( x o b , t k − α k ∇ t f s d f ( x o b , t k ) ) ≤ f s d f ( x o b , t k ) − c α k ∥ ∇ t f s d f ( x o b , t k ) ∥ 2 f_{sdf}(\boldsymbol{x}_{ob}, t_k - \alpha_k \nabla_t f_{sdf}(\boldsymbol{x}_{ob}, t_k)) \leq f_{sdf}(\boldsymbol{x}_{ob}, t_k) - c \alpha_k \|\nabla_t f_{sdf}(\boldsymbol{x}_{ob}, t_k)\|^2 fsdf(xob,tkαktfsdf(xob,tk))fsdf(xob,tk)cαktfsdf(xob,tk)2

其中 c ∈ ( 0 , 1 ) c\in(0,1) c(0,1) 是一个常数参数,通常取 c = 0.1 c=0.1 c=0.1 或更小。这个条件保证了每一步都能显著降低函数值。Armijo 搜索通过反复试探步长,在降低函数值和缩短搜索时间之间取得平衡。

综合使用梯度下降和 Armijo 线搜索,可以高效稳定地找到 t ∗ t^* t。本文的实验表明,每次查询只需要微秒级的时间,速度很快。这得益于以下几点:

  1. t ∗ t^* t f s d f ∗ f^*_{sdf} fsdf 具有时空连续性,易于数值求解。
  2. f s d f f_{sdf} fsdf 的解析梯度避免了数值微分的开销。
  3. 多点初始化策略提高了收敛速度和全局最优性。

这部分计算是整个轨迹优化的基础,它提供了快速、精确的碰撞检测信息。基于此,文章进一步构建了一个梯度下降的优化框架,最小化各种损失函数(如安全性、平滑性等),生成一条最优轨迹。从这个意义上说,高效 SDF 计算是本文的一个关键环节,它体现了隐式表示和时空连续性在轨迹优化中的巧妙应用。

2.微分平坦性(Differential Flatness)

微分平坦性(Differential Flatness)是控制理论中的一个重要概念,主要用于简化非线性系统的轨迹生成和控制问题。一个系统被称为微分平坦的,如果它的所有状态变量和控制输入都可以用一组特殊变量(称为平坦输出)及其导数来表示。

形式化地说,考虑一个具有状态变量 x ∈ R n \boldsymbol{x}\in\mathbb{R}^n xRn 和控制输入 u ∈ R m \boldsymbol{u}\in\mathbb{R}^m uRm 的非线性系统:

x ˙ = f ( x , u ) \dot{\boldsymbol{x}} = f(\boldsymbol{x}, \boldsymbol{u}) x˙=f(x,u)

如果存在一组变量 z ∈ R m \boldsymbol{z}\in\mathbb{R}^m zRm (平坦输出),使得状态和控制输入都可以表示为 z \boldsymbol{z} z 及其导数的函数:

x = ϕ ( z , z ˙ , … , z ( p ) ) u = ψ ( z , z ˙ , … , z ( q ) ) \begin{aligned} \boldsymbol{x} &= \phi(\boldsymbol{z}, \dot{\boldsymbol{z}}, \ldots, \boldsymbol{z}^{(p)}) \\ \boldsymbol{u} &= \psi(\boldsymbol{z}, \dot{\boldsymbol{z}}, \ldots, \boldsymbol{z}^{(q)}) \end{aligned} xu=ϕ(z,z˙,,z(p))=ψ(z,z˙,,z(q))

其中 p , q p,q p,q 是有限整数,则称该系统是微分平坦的,而 z \boldsymbol{z} z 就是该系统的平坦输出。

微分平坦性的重要性在于:

  1. 它将非线性系统的状态空间轨迹规划问题转化为平坦输出空间的轨迹规划问题。后者通常是一个低维空间,约束条件更少,因此大大简化了轨迹生成任务。
  2. 在平坦输出空间设计的轨迹可以通过微分平坦性映射回原状态空间,保证动力学可行性。这避免了在原空间进行复杂的约束优化。
  3. 它为非线性系统提供了一种系统的控制方法。只需在平坦输出空间设计简单的控制律(如PID),然后通过微分平坦性变换即可得到原系统的控制输入。

用一种更直观的方式解释微分平坦性。

举个例子来说,假设有一个机器人,它的状态由位置 x x x,速度 v v v,加速度 a a a 组成。通常,你需要知道这三个量才能完全描述机器人的运动状态。但如果这个机器人满足微分平坦性,那么你只需要知道其中一个量,比如位置 x x x,就可以推导出其他两个量。

这是因为,如果系统是微分平坦的,那么所有状态变量和控制输入都可以写成某个特殊变量(平坦输出)及其导数的函数。在这个例子中,如果位置 x x x 是平坦输出,那么:

v = x ˙ a = x ¨ \begin{aligned} v &= \dot{x} \\ a &= \ddot{x} \end{aligned} va=x˙=x¨

这意味着,一旦我们知道了位置 x x x 随时间的函数关系,就自动知道了速度 v v v 和加速度 a a a。这个性质在轨迹规划中非常有用。

假设我们要让机器人从起点移动到终点。如果不考虑微分平坦性,我们需要同时规划位置、速度、加速度的轨迹,并确保它们之间满足微分关系,这可能很复杂。但如果系统是微分平坦的,我们只需要规划一条满足起点和终点约束的位置轨迹 x ( t ) x(t) x(t),然后自动得到速度轨迹 v ( t ) = x ˙ ( t ) v(t)=\dot{x}(t) v(t)=x˙(t) 和加速度轨迹 a ( t ) = x ¨ ( t ) a(t)=\ddot{x}(t) a(t)=x¨(t),大大简化了问题。

对于四旋翼无人机,情况类似但更复杂一些。它的平坦输出是位置 p \boldsymbol{p} p 和偏航角 ψ \psi ψ。给定 p ( t ) \boldsymbol{p}(t) p(t) ψ ( t ) \psi(t) ψ(t),我们可以推导出速度 v ( t ) \boldsymbol{v}(t) v(t),加速度 a ( t ) \boldsymbol{a}(t) a(t),姿态角 Ω ( t ) \boldsymbol{\Omega}(t) Ω(t) 和姿态角速度 Ω ˙ ( t ) \dot{\boldsymbol{\Omega}}(t) Ω˙(t)。这就是论文中的那个公式:

v ( t ) = p ˙ ( t ) a ( t ) = p ¨ ( t ) Ω ( t ) = f 1 ( p , p ˙ , p ¨ , ψ ) Ω ˙ ( t ) = f 2 ( p , p ˙ , p ¨ , ˙ p ¨ , ψ , ψ ˙ ) \begin{aligned} \boldsymbol{v}(t) &= \dot{\boldsymbol{p}}(t) \\ \boldsymbol{a}(t) &= \ddot{\boldsymbol{p}}(t) \\ \boldsymbol{\Omega}(t) &= f_1(\boldsymbol{p}, \dot{\boldsymbol{p}}, \ddot{\boldsymbol{p}}, \psi) \\ \dot{\boldsymbol{\Omega}}(t) &= f_2(\boldsymbol{p}, \dot{\boldsymbol{p}}, \ddot{\boldsymbol{p}}, \dot{}\ddot{\boldsymbol{p}}, \psi, \dot{\psi}) \end{aligned} v(t)a(t)Ω(t)Ω˙(t)=p˙(t)=p¨(t)=f1(p,p˙,p¨,ψ)=f2(p,p˙,p¨,˙p¨,ψ,ψ˙)

因此,在轨迹规划时,我们只需要关注四维的平坦输出空间 ( p , ψ ) (\boldsymbol{p}, \psi) (p,ψ),而不是十二维的原状态空间 ( p , v , a , Ω , Ω ˙ ) (\boldsymbol{p}, \boldsymbol{v}, \boldsymbol{a}, \boldsymbol{\Omega}, \dot{\boldsymbol{\Omega}}) (p,v,a,Ω,Ω˙),问题复杂度大大降低。

总的来说,微分平坦性通过揭示系统内在的简单结构,允许我们在一个低维空间进行轨迹规划,然后自动满足原系统的动力学约束,提供了一种简化复杂系统控制的强大工具。这就是它在机器人轨迹规划中的重要性。

在本文中,四旋翼无人机系统就具有微分平坦性。选择其位置 p ( t ) \boldsymbol{p}(t) p(t) 和偏航角 ψ ( t ) \psi(t) ψ(t) 作为平坦输出,则速度 v ( t ) \boldsymbol{v}(t) v(t)、加速度 a ( t ) \boldsymbol{a}(t) a(t)、姿态角 Ω ( t ) \boldsymbol{\Omega}(t) Ω(t) 和姿态角速度 Ω ˙ ( t ) \dot{\boldsymbol{\Omega}}(t) Ω˙(t) 都可以由平坦输出表示:

v ( t ) = p ˙ ( t )   a ( t ) = p ¨ ( t )   Ω ( t ) = f 1 ( p , p ˙ , p ¨ , ψ )   Ω ˙ ( t ) = f 2 ( p , p ˙ , p ¨ , ˙ p ¨ , ψ , ψ ˙ ) \begin{aligned} \boldsymbol{v}(t) &= \dot{\boldsymbol{p}}(t) \ \boldsymbol{a}(t) &= \ddot{\boldsymbol{p}}(t) \ \boldsymbol{\Omega}(t) &= f_1(\boldsymbol{p}, \dot{\boldsymbol{p}}, \ddot{\boldsymbol{p}}, \psi) \ \dot{\boldsymbol{\Omega}}(t) &= f_2(\boldsymbol{p}, \dot{\boldsymbol{p}}, \ddot{\boldsymbol{p}}, \dot{}\ddot{\boldsymbol{p}}, \psi, \dot{\psi}) \end{aligned} v(t)=p˙(t) a(t)=p¨(t) Ω(t)=f1(p,p˙,p¨,ψ) Ω˙(t)=f2(p,p˙,p¨,˙p¨,ψ,ψ˙)

上述公式表示了四旋翼无人机系统的微分平坦性。其中:

  • v ( t ) \boldsymbol{v}(t) v(t) 是速度,它等于位置 p ( t ) \boldsymbol{p}(t) p(t) 的一阶导数。
  • a ( t ) \boldsymbol{a}(t) a(t) 是加速度,它等于位置 p ( t ) \boldsymbol{p}(t) p(t) 的二阶导数。
  • Ω ( t ) \boldsymbol{\Omega}(t) Ω(t) 是姿态角,它可以由位置及其一阶、二阶导数和偏航角 ψ \psi ψ 表示,具体函数关系为 f 1 f_1 f1
  • Ω ˙ ( t ) \dot{\boldsymbol{\Omega}}(t) Ω˙(t) 是姿态角速度,它可以由位置及其一至三阶导数、偏航角及其一阶导数表示,具体函数关系为 f 2 f_2 f2

对于四旋翼系统,只要规划出位置轨迹 p ( t ) \boldsymbol{p}(t) p(t) 和偏航角轨迹 ψ ( t ) \psi(t) ψ(t),就可以推导出所有其他状态量。这大大简化了轨迹优化问题。

我们只需规划位置轨迹 p ( t ) \boldsymbol{p}(t) p(t),其他所有状态量都可由此导出,从而将轨迹优化问题的维度从12降到4,极大地提高了计算效率。同时,只要位置轨迹 p ( t ) \boldsymbol{p}(t) p(t) 满足动力学约束(如速度、加速度限制),其他状态量必然也满足相应约束。这保证了生成轨迹的动力学可行性。

综上,微分平坦性通过降维简化了轨迹优化问题,是一个非常有用的系统特性。对于四旋翼等许多机器人系统,利用其微分平坦性可以极大提升轨迹规划的效率和质量,这也是本文采用该特性的原因。

3.附录

这篇paper的附录主要讲述了如何高效地计算 t ∗ t^* t 对优化变量的梯度。这是轨迹优化的一个关键步骤。

在前面的章节中论述了 t ∗ t^* t 是使 f s d f ( x o b , t ) f_{sdf}(\boldsymbol{x}_{ob}, t) fsdf(xob,t) 最小化的时刻,即满足以下条件:

f ˙ s d f ∣ t ∗ , x o b = 0 \dot{f}_{sdf}|_{t^*,\boldsymbol{x}_{ob}} = 0 f˙sdft,xob=0

根据四旋翼的动力学特性,可以将上式简化为:

f ˙ s d f ∣ x o b = ( ∇ S D F B ∣ x r e l ) T ( ω ^ R T ( p − x o b ) − R T v ) \dot{f}_{sdf}|_{\boldsymbol{x}_{ob}} = (\nabla SDF_B|_{\boldsymbol{x}_{rel}})^T (\hat{\omega}R^T(\boldsymbol{p} - \boldsymbol{x}_{ob}) - R^T\boldsymbol{v}) f˙sdfxob=(SDFBxrel)T(ω^RT(pxob)RTv)

其中 ω ^ \hat{\omega} ω^ 是角速度的斜对称矩阵。为方便起见,定义:

X ( R , p ) = ( ∇ S D F B ∣ x r e l ) T Y ( R , ω ^ , p , v ) = ω ^ R T ( p − x o b ) − R T v F ( t ∗ , ζ ) = f ˙ s d f ∣ x o b = X ⋅ Y ≡ 0 \begin{aligned} X(R, \boldsymbol{p}) &= (\nabla SDF_B|_{\boldsymbol{x}_{rel}})^T \\ Y(R, \hat{\omega}, \boldsymbol{p}, \boldsymbol{v}) &= \hat{\omega}R^T(\boldsymbol{p}-\boldsymbol{x}_{ob})-R^T\boldsymbol{v} \\ F(t^*, \boldsymbol{\zeta}) &= \dot{f}_{sdf}|_{\boldsymbol{x}_{ob}} = X \cdot Y \equiv 0 \end{aligned} X(R,p)Y(R,ω^,p,v)F(t,ζ)=(SDFBxrel)T=ω^RT(pxob)RTv=f˙sdfxob=XY0

其中 ζ \boldsymbol{\zeta} ζ 表示状态变量 ( p , v , ω , R ) (\boldsymbol{p}, \boldsymbol{v}, \boldsymbol{\omega}, R) (p,v,ω,R)

要计算 ∂ t ∗ / ∂ ζ \partial t^*/\partial \boldsymbol{\zeta} t/ζ,关键是利用隐函数定理。由于 F ( t ∗ ( ζ ) , ζ ) ≡ 0 F(t^*(\boldsymbol{\zeta}), \boldsymbol{\zeta}) \equiv 0 F(t(ζ),ζ)0,对其求导可得:

d F d ζ = ∂ F ∂ t ∗ ∂ t ∗ ∂ ζ + ∂ F ∂ ζ ≡ 0 \frac{dF}{d\boldsymbol{\zeta}} = \frac{\partial F}{\partial t^*}\frac{\partial t^*}{\partial \boldsymbol{\zeta}} + \frac{\partial F}{\partial \boldsymbol{\zeta}} \equiv 0 dζdF=tFζt+ζF0

因此:

∂ t ∗ ∂ ζ = − ∂ F ∂ ζ / ∂ F ∂ t ∗ \frac{\partial t^*}{\partial \boldsymbol{\zeta}} = -\frac{\partial F}{\partial \boldsymbol{\zeta}} / \frac{\partial F}{\partial t^*} ζt=ζF/tF

∂ F / ∂ t ∗ \partial F/\partial t^* F/t ∂ F / ∂ ζ \partial F/\partial \boldsymbol{\zeta} F/ζ 可以通过链式法则计算:

∂ F ∂ t ∗ = X ∂ Y ∂ t ∗ + ∂ X ∂ t ∗ Y ∂ F ∂ ζ = X ∂ Y ∂ ζ + ∂ X ∂ ζ Y \begin{aligned} \frac{\partial F}{\partial t^*} &= X\frac{\partial Y}{\partial t^*} + \frac{\partial X}{\partial t^*}Y \\ \frac{\partial F}{\partial \boldsymbol{\zeta}} &= X\frac{\partial Y}{\partial \boldsymbol{\zeta}} + \frac{\partial X}{\partial \boldsymbol{\zeta}}Y \end{aligned} tFζF=XtY+tXY=XζY+ζXY

其中 ∂ X / ∂ t ∗ , ∂ Y / ∂ t ∗ , ∂ X / ∂ ζ , ∂ Y / ∂ ζ \partial X/\partial t^*, \partial Y/\partial t^*, \partial X/\partial \boldsymbol{\zeta}, \partial Y/\partial \boldsymbol{\zeta} X/t,Y/t,X/ζ,Y/ζ 都可以通过机器人和环境的几何关系解析求得(论文中给出了具体公式,这里不再赘述)。

有了 ∂ t ∗ / ∂ ζ \partial t^*/\partial \boldsymbol{\zeta} t/ζ,再利用链式法则就可以计算 t ∗ t^* t 对优化变量 c \boldsymbol{c} c T \boldsymbol{T} T 的梯度:

∂ t ∗ ∂ c , T = ∑ ζ = p , v , a , j ∂ t ∗ ∂ ζ ⋅ ∂ ζ ∂ c , T \frac{\partial t^*}{\partial \boldsymbol{c},\boldsymbol{T}} = \sum_{\boldsymbol{\zeta}=\boldsymbol{p},\boldsymbol{v},\boldsymbol{a},\boldsymbol{j}} \frac{\partial t^*}{\partial \boldsymbol{\zeta}} \cdot \frac{\partial \boldsymbol{\zeta}}{\partial \boldsymbol{c},\boldsymbol{T}} c,Tt=ζ=p,v,a,jζtc,Tζ

其中 ∂ ζ / ∂ c , T \partial \boldsymbol{\zeta}/\partial \boldsymbol{c},\boldsymbol{T} ζ/c,T 可以通过微分平坦性求得。

上面详细阐述了如何利用隐函数定理和链式法则,高效地计算 t ∗ t^* t 对优化变量的梯度。这避免了对 t ∗ t^* t 的数值微分,大大提高了优化效率。同时,由于所有梯度都有解析表达式,优化过程也更加稳定。

这部分内容通过巧妙地利用隐函数定理,作者成功地将一个看似难以处理的问题( t ∗ t^* t 是通过优化得到的,似乎无法直接求导)转化为了一个可解析求导的问题。这种数学上的创新是本文的一大亮点,也为其高效的轨迹优化算法奠定了基础。

以上就是我对改文章重难点的解析,支持的话可以关注下github:FanZexuan ,准备发布一个完整的导航算法/so3动力学的hands-on by python 教程

论文可自行搜索英文题目或是去fastlab github下载

  • 25
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值