论文阅读《Visual Measurement Integrity Monitoring for UAV Localization》

1 摘要

无人机(UAV)越来越多地应用于安全、安保和救援任务中,因为它们需要对所处环境进行精确和可靠的位姿估计。为了保证视觉定位时的任务安全,有必要对视觉定位方案的完好性进行评估。然而,据我们所知,这种基于优化的视觉定位的完好性监测算法并不存在。接收机自主完好性监测(RAIM)在全球卫星导航系统(GNSS)中得到了广泛的应用,如飞机自主着陆等。本文受RAIM的启发,提出了一种新的方法来监测基于优化的视觉定位的完好性,并计算估计的位姿的保护水平,即各个方向上最大可能的平移误差。我们还提出了一个定量评估误差包络性能的度量。最后,我们使用EuRoC数据集验证了该保护水平,并证明了所提出的保护水平比常用的 3 σ 3\sigma 3σ方法提供了一个更可靠的包络。

2 介绍

近年来,无人机(UAV)在事件安全、搜索和救援、安全监视等具有挑战性的应用中取得了成功。对于某些特定的操作领域,例如室内、地下或城市中心,在UAV上的全球导航卫星系统(GNSS)信息并不总是可用或可靠。因此,无人机在这些地区部署的可行性在很大程度上取决于基于视觉的定位的准确性,作为GNSS系统的补充和替代。UAV未能正确执行定位任务可能导致严重损害车辆或附近的人。因此,不仅要利用视觉信息对无人机进行精确定位,而且要了解当前定位估计的可靠性,最大限度地减少视觉定位过程中未检测出的故障的可能性。

许多无人机视觉定位或SLAM算法已被开发出来,能够提供较长时间的鲁棒状态估计,如[1]和[2]。虽然这些算法能够以较低的故障率运行,但通过不断评估无人机上计算的状态估计的完好性,仍有可能进一步提高无人机状态估计的鲁棒性。完好性衡量的是对定位解决方案正确性的信任程度。

在机器人视觉定位中, 3 σ 3\sigma 3σ(正负3倍标准差)常被用来度量状态估计的不确定性边界,这相当于99.7%的概率下真值在该区域内。然而, 3 σ 3\sigma 3σ仅限定了在测量中没有外点的情况下的状态误差,即没有从建模的测量分布之外获得的测量值。对于现实生活中的无人机视觉定位,假设视觉前端工作良好,在任何时间测量中都没有外点是不合理的,因为视觉前端依赖于帧与帧之间的特征对应,这一过程很容易出错。因此, 3 σ 3\sigma 3σ方法往往过于激进,且不能包络无人机真实状态的误差。

本文工作的灵感来自于接收机自主完好性监测(RAIM),这是一种用于评估GNSS信号完好性的监测算法。它特别用于自主飞行着陆和其它对安全至关重要的GNSS应用中。RAIM首先使用冗余的测量数据来检查接收到的测量数据的一致性,并从单个卫星中检测出可能的错误测量数据。然后,确定水平方向保护水平(HPL)和垂直方向保护水平(VPL),这是故障检测算法在水平方向和垂直方向上不希望检测到的最大误差。近几年,将RAIM用于机器人定位的思想主要用于基于滤波的算法,而不是基于优化的算法。

虽然完好性监测是一个成熟的GNSS应用领域,但将其应用到基于优化的无人机视觉定位中仍具有重要意义。首先,在大多数无人机视觉定位算法中,系统依靠特征来代替卫星提供测量,与GNSS应用相比,测量数目要多得多。其次,在RAIM中,两颗卫星同时出现故障是很少见的。然而,对于视觉定位,不正确的测量值或外点的绝对数量要高得多,外点的比例通常大于10%。因此,需要一种不同的外点剔除方法来处理多个外点。此外,在GNSS应用中,每个卫星提供1个测量,但在视觉定位中,每个特征分别为单目或双目提供2个或3个测量。

在本文中,我们提出了一种新的状态估计的完好性监测方法,用于基于优化的无人机视觉定位中。我们首先使用基于[7]的统计方法来检测和排除不一致的视觉测量,并扩展了我们之前的工作[8]。然后计算出无人机状态下可能存在的最大平移误差。本文的主要贡献有:
(1)一种新的度量称为松弛包络紧度,它定量地评估了在高斯分布误差假设的应用中误差包络的性能。
(2)提出了一种基于优化的视觉定位的无人机状态估计误差近似上界确定方法,该方法比典型的 3 σ 3\sigma 3σ方法可靠得多。

本文的其余部分概述如下。相关工作将在第二节中讨论。在第三节中详细讨论了外点剔除和保护水平计算算法。提出的评估误差包络的度量如第四节所示。最后,本文方法的验证结果如第五节所示。

3 相关的工作

3.1 接收机自主完好性监测

完好性监测的概念已经发展并应用于GNSS领域。它是安全关键应用的必要组件,在这些应用中,不可靠的解决方案可能导致严重的伤害或死亡。RAIM是航空应用中最常用的完好性监测算法之一。它有两个基本功能。一是利用故障检测与排除算法检测卫星是否存在故障。二是计算 H P L HPL HPL V P L VPL VPL,这是故障检测算法不期望检测到的最大水平和垂直误差。Brown等人提出了第一个数学上严格的RAIM算法,该算法利用统计理论来检查冗余GPS测量的一致性,并与提供足够一致性的测量组计算HPL。Walter等人以Brown的方法为基础,开发出了加权的RAIM。他们工作的主要思想是,来自每个单独卫星的测量数据有不同水平的噪声。因此,他们不假设所有卫星都有一个固定的协方差值,而是建议通过将噪声加权协方差赋值给不同卫星的测量模型,以不同的方式来信任来自卫星的测量结果。两种方法都假设在故障检测算法完成后,系统中最多存在一个故障测量,然后根据该假设计算出保护水平。Angus修改了Brown和Walter提出的算法,在测量中考虑到有多个故障卫星。在视觉定位场景中,处理多个故障测量的能力非常有用,因为根据相机设置,每个特征对应2个或者3个测量值。因此,为了在视觉定位中考虑一个故障的特征,我们需要考虑2或3个故障的测量。

3.2 基于视觉的定位

基于视觉的定位或SLAM算法可以分为两大类,直接法和基于特征的方法。直接法将整个图像作为测量,以最小化光度误差为目标。基于特征的方法从图像中提取关键点,目标是最小化重投影误差。ORB-SLAM2是一种最先进的基于特征的SLAM系统,适用于单目、双目和RGB-D相机。其SLAM模式通过光束平差法来构造地图。ORB-SLAM2也有一个定位模式,允许重用地图,通过位姿优化来确定主体的状态。此外,结合视觉和惯性测量也显示了性能的提升,特别是在无人机应用中,例如[2]等。虽然这些算法在实验中表现出了很好的性能,但假设测量在任何时候都是无故障的是不合理的,因为从帧到帧寻找特征的对应关系时一个很容易出错的过程,特别是在动态环境中。本文的工作主要适用于基于特征的视觉定位,我们使用ORB-SLAM2的定位模式来验证我们的方法,如第6节所示。

3.3 视觉测量的外点剔除

RANSAC已广泛应用于基于视觉的机器人定位中,用于剔除特征外点。RANSAC的基本思想是用随机样本集来形成假设,再用其它样本来验证这些假设,并选择一致性最高的假设作为内点集合。另一种方法是使用统计测试来检验测量集是否符合假设的统计模型,如奇偶空间法和归一化新息平方法。这两种方法都假设测量模型的噪声服从高斯分布,并检验加权平方残差和是否服从 χ 2 \chi^2 χ2分布。奇偶空间法不需要系统的状态,它通过将一组冗余测量值投影到奇偶空间来检查它们的一致性。另一方面,归一化新息平方法假设一个估计的状态是已知的,并且它通常用于检查单个测量值是否为外点。Tong等人提出了一种批量新息测试,该测试扩展了归一化新息平方法,以去除批量测量中的外点。最近,Tzoumas等人提出了一种自适应修剪算法,该算法也是基于残差值来剔除外点。与使用固定的阈值不同,该算法中的阈值在每次迭代中都会更新。在本文中,我们将Tong的方法与奇偶空间法相结合,迭代剔除了多个外点,从而计算出了保护水平。

4 完好性监测框架

4.1 问题表述

在本节中,我们将展示双目相机设置下的问题表述。我们将基于视觉的定位作为一种非线性位姿优化。目标是通过最小化特征的重投影误差来确定相机当前帧的状态。我们遵循Barfoot引入的符号。有两个坐标系,即惯性坐标系 F i \mathcal{F}_i Fi和与左相机中心相对应的相机坐标系 F c \mathcal{F}_c Fc。相机的状态定义为 x = { r i c i , C c i } x=\{r_i^{ci},C_{ci}\} x={rici,Cci},它是指惯性坐标系到相机坐标系的变换矩阵,其中 r i c i ∈ R 3 r_i^{ci}\in \mathbb{R}^3 riciR3 C c i ∈ S O ( 3 ) C_{ci} \in \mathbb{SO}(3) CciSO(3)。在进行定位之前,先用特征构建一张地图, r i p j i r_i^{p_ji} ripji表示特征 j j j在惯性坐标系中的位置。首先将特征位置从惯性坐标系变换到相机坐标系,然后再将特征位置投影到图像坐标平面,公式如下:
r c p j c = [ x y z ] = C c i ( r i p j i − r i c i ) (1) \pmb{r}_c^{p_jc}=\begin{bmatrix} x \\ y\\ z \end{bmatrix}=\pmb{C}_{ci}(\pmb{r}_i^{p_ji}-\pmb{r}_i^{ci}) \tag{1} rrrcpjc=xyz=CCCci(rrripjirrrici)(1)
[ u l v l δ d ] = π ( r c p j c ) = 1 z [ f u x f v y f u b ] + [ c u c v 0 ] + e j (2) \begin{bmatrix} u_l \\ v_l \\ \delta_d \end{bmatrix}=\pi(\pmb{r}_c^{p_jc})=\frac{1}{z}\begin{bmatrix} f_ux \\ f_vy \\ f_ub\end{bmatrix} + \begin{bmatrix} c_u \\ c_v \\ 0 \end{bmatrix} +\pmb{e}_j \tag{2} ulvlδd=π(rrrcpjc)=z1fuxfvyfub+cucv0+eeej(2)
e j ∼ N ( 0 , Q j ) (3) \pmb{e}_j \sim \mathcal{N}(\pmb{0},\pmb{Q}_j) \tag{3} eeejN(000,QQQj)(3)
其中 u l u_l ul v l v_l vl是左边图像中的坐标, δ d \delta_d δd是视差, f u f_u fu f v f_v fv是焦距, c u c_u cu c v c_v cv是光心坐标, b b b是基线, π \pi π是双目相机投影函数, e j \pmb{e}_j eeej是测量噪声,它服从零均值协方差为 Q j \pmb{Q}_j QQQj的高斯分布。在每一个图像帧中,位姿优化可以表述如下:
x ∗ = { r i c i ∗ , C c i ∗ } = a r g m i n r i c i , C c i ∑ j ρ ( e y , j T Q j − 1 e y , j ) (4) \pmb{x}^*=\{\pmb{r}_i^{ci*},\pmb{C}_{ci}^*\}=\underset{{r}_i^{ci},{C}_{ci}}{argmin}\sum_j\rho(\pmb{e}^T_{y,j}\pmb{Q}_j^{-1}\pmb{e}_{y,j}) \tag{4} xxx={rrrici,CCCci}=rici,Cciargminjρ(eeey,jTQQQj1eeey,j)(4)
其中 ρ \rho ρ是Huber损失函数, e y , j \pmb{e}_{y,j} eeey,j是特征 j j j测量误差,可用下式确定,
e y , j ( x ) = y j − π ( C c i ( r i p j i − r i c i ) ) (5) \pmb{e}_{y,j}(\pmb{x})=\pmb{y}_j-\pi(\pmb{C}_{ci}(\pmb{r}_i^{p_ji}-\pmb{r}_i^{ci})) \tag{5} eeey,j(xxx)=yyyjπ(CCCci(rrripjirrrici))(5)
其中 y j y_j yj是特征 j j j的测量。

4.2 故障检测与排除

本小节展示了在视觉测量上如何应用故障检测与排除算法,它受RAIM启发,利用奇偶空间法。首先,对于每个特征 j j j我们有如下测量模型,
y j = h j ( x ) + e j (6) \pmb{y}_j=h_j(\pmb{x})+\pmb{e}_j \tag{6} yyyj=hj(xxx)+eeej(6)
其中特征 j j j的测量函数 h j ( x ) : R 6 ⇒ R 3 h_j(\pmb{x}): \mathbb{R}^6\Rightarrow \mathbb{R}^3 hj(xxx):R6R3定义如下,
h j ( x ) = π ( C c i ( r i p j i − r i c i ) ) (7) h_j(\pmb{x})=\pi(\pmb{C}_{ci}(\pmb{r}_i^{p_ji}-\pmb{r}_i^{ci})) \tag{7} hj(xxx)=π(CCCci(rrripjirrrici))(7)
然后将测量函数 h j ( x ) h_j(\pmb{x}) hj(xxx)关于某工作点 x 0 \pmb{x}_0 xxx0线性化,得到线性化的测量模型:
d y j = H j ⋅ d x + e j (8) d\pmb{y}_j=\pmb{H}_j\cdot d\pmb{x}+\pmb{e}_j \tag{8} dyyyj=HHHjdxxx+eeej(8)
其中 d x ∈ R 6 d\pmb{x}\in\mathbb{R}^6 dxxxR6表示状态扰动, H ∈ R 3 × 6 \pmb{H}\in\mathbb{R}^{3\times6} HHHR3×6是测量模型的雅克比, d y j ∈ R 3 d\pmb{y}_j\in\mathbb{R}^3 dyyyjR3为特征 j j j根据工作点 x 0 \pmb{x}_0 xxx0偏移的测量值。通过对当前帧中观察到的 N N N个特征进行 d y j d\pmb{y}_j dyyyj H j \pmb{H}_j HHHj和协方差矩阵 Q j \pmb{Q}_j QQQj的叠加,我们做出如下定义:
d y = [ d y 1 ⋮ d y N ] ,   Q = [ Q 1 ⋱ Q N ] ,   H = [ H 1 ⋮ H N ] (9) d\pmb{y}=\begin{bmatrix} d\pmb{y}_1 \\ \vdots \\ d\pmb{y}_N \end{bmatrix},\ \pmb{Q}=\begin{bmatrix} \pmb{Q}_1 & & \\ & \ddots & \\ & & \pmb{Q}_N\end{bmatrix},\ \pmb{H}=\begin{bmatrix} \pmb{H}_1 \\ \vdots \\ \pmb{H}_N \end{bmatrix} \tag{9} dyyy=dyyy1dyyyN, QQQ=QQQ1QQQN, HHH=HHH1HHHN(9)
公式(8)的叠加形式如下,
d y = H ⋅ d x + e (10) d\pmb{y}=\pmb{H}\cdot d\pmb{x}+\pmb{e} \tag{10} dyyy=HHHdxxx+eee(10)
其中,
e ∼ N ( 0 , Q ) (11) e\sim \mathcal{N}(\pmb{0}, \pmb{Q}) \tag{11} eN(000,QQQ)(11)
我们将信息矩阵 W W W定义为 Q Q Q的逆,
W = Q − 1 (12) \pmb{W} = \pmb{Q}^{-1} \tag{12} WWW=QQQ1(12)
估计扰动为公式(10)的加权最小二乘解,即
d x ^ = ( H T W H ) − 1 H T W d y (13) d\hat{x}=(\pmb{H}^T\pmb{W}\pmb{H})^{-1}\pmb{H}^T\pmb{W}d\pmb{y} \tag{13} dx^=(HHHTWWWHHH)1HHHTWWWdyyy(13)
残差可以进一步计算如下,
ϵ = d y − H d x ^ = ( I − H ( H T W H ) − 1 H T W ) d y (14) \epsilon=d\pmb{y}-\pmb{H}d\hat{x}=(\pmb{I}-\pmb{H}(\pmb{H}^T\pmb{WH})^{-1}\pmb{H}^T\pmb{W})d\pmb{y} \tag{14} ϵ=dyyyHHHdx^=(IIIHHH(HHHTWHWHWH)1HHHTWWW)dyyy(14)
然而,如果测量中存在外点,公式(10)要改写成,
d y = H ⋅ d x + e + f (15) d\pmb{y}=\pmb{H}\cdot d\pmb{x}+\pmb{e} + \pmb{f}\tag{15} dyyy=HHHdxxx+eee+fff(15)
其中 f ∈ R 3 N f\in \mathbb{R}^{3N} fR3N是在假设测量中存在外点的情况下,对测量中的误差进行建模的故障向量。那么,公式(14)需改写成,
ϵ = ( I − H ( H T W H ) − 1 H T W ) ( d y − f ) (16) \epsilon=(\pmb{I}-\pmb{H}(\pmb{H}^T\pmb{WH})^{-1}\pmb{H}^T\pmb{W})(d\pmb{y}-\pmb{f}) \tag{16} ϵ=(IIIHHH(HHHTWHWHWH)1HHHTWWW)(dyyyfff)(16)
然后计算加权平方和残差:
λ = ϵ T W ϵ (17) \lambda=\epsilon^T\pmb{W}\epsilon \tag{17} λ=ϵTWWWϵ(17)
我们可以利用 λ \lambda λ来确定测量集中是否存在外点,且将 λ \sqrt{\lambda} λ 定义为检验统计量。如果测量集中没有外点,依据奇偶空间法,那么 λ \lambda λ服从 n − m n-m nm自由度的中心 χ 2 \chi^2 χ2分布。其中 n n n表示测量的数量, m m m表示状态的数量,在视觉定位情况下, n = 3 N n=3N n=3N m = 6 m=6 m=6。如果测量集中存在外点, λ \lambda λ服从非中心的 χ 2 \chi^2 χ2分布。利用加权平方和残差, λ \lambda λ,来判断定位解是否无外点。通过计算中心 χ 2 \chi^2 χ2分布的 1 − P f a 1-P_{fa} 1Pfa分位数(自由度为 3 N − 6 3N-6 3N6),可以根据期望的虚警概率 P f a P_{fa} Pfa解析地选择虚警阈值 δ \delta δ。如果 λ < δ \lambda<\delta λ<δ,则检验表明测量值之间是一致的,可以认为测量值中没有外点;如果 λ > δ \lambda>\delta λ>δ,有 1 − P f a 1-P_{fa} 1Pfa的概率认为测量集中至少存在一个故障。

如果测量集通过了外点检测算法,我们可以直接计算出保护水平,见第4.3节。如果发现测量集中包含外点,我们需要执行外点排除。在GNSS应用中,两颗卫星同时故障的情况很少见,但与此不同的是,视觉测量中的外点比例要高得多。因此,在基于视觉的定位中,需要一种不同的方法来排除测量中的外点。

我们对[7]中的方法进行了修改,提出了迭代奇偶空间外点拒绝法(IPSOR),排除多个外点用于完好性监测。两种算法都计算一组测量值的加权平方和残差,并迭代排除外点,直到其余测量值通过残差阈值检验。具体来说,IPSOR策略排除对统计检验量贡献最大的特征,并将其分类为外点,直到统计检验量 λ \lambda λ阈值 δ \delta δ。然后,我们将剩余的测量值分类为内点,并再次计算检验统计量。如果更新后的检验统计量小于更新后的阈值 δ \delta δ,则外点已完全排除。否则,我们重复此过程。在此过程中,如果内点数目小于阈值,则认为测量集中外点过多,定位解不可信。这种方法依赖于内部测量彼此一致和外点测量差异很大的假设。使用高斯牛顿法,IPSOR方法可以迭代应用,获得更好的线性化状态 x 0 \pmb{x}_0 xxx0,以避免排除内点。
在这里插入图片描述

4.3 计算保护水平

在视觉定位中,我们把保护水平定义为外点检测算法不期望检测到的每个方向上的最大平移误差,标记为 P L x PL_{x} PLx P L y PL_{y} PLy P L z PL_{z} PLz,它们必须考虑可能的外点和噪声引入的误差。同样的方法也可以计算出总距离的保护水平,但我们使用的是特定轴的保护水平,以便与 3 σ 3\sigma 3σ方法进行比较。我们遵循并修改了Walter和Angus提出的方法来计算保护水平。一旦测量通过外点排除算法,我们假设测量中至多有一个外点。如果测量中有超过一个的故障特征,那么测量就不太可能通过外点排除测试。此外,根据应用的不同,我们总是可以考虑更多的故障特征,以获得更保守的保护水平。

为了解析确定 P L x PL_x PLx P L y PL_y PLy P L z PL_z PLz,我们遵循[11]中的问题表述。由于每个特征产生3个测量值,我们将公式(15)中的故障向量 f \pmb{f} fff表示为,
f = P j f ∗ (18) \pmb{f}=\pmb{P}_j\pmb{f}^*\tag{18} fff=PPPjfff(18)
其中 f ∗ ∈ R 3 \pmb{f}^*\in\mathbb{R}^3 fffR3,且 P j ∈ R 3 N × 3 \pmb{P}_j\in\mathbb{R}^{3N\times3} PPPjR3N×3。在 P j \pmb{P}_j PPPj中每个 3 × 3 3\times3 3×3矩阵代表一个特征。对 P j \pmb{P}_j PPPj而言,第 j j j 3 × 3 3\times3 3×3矩阵是单位阵,其余的都是零矩阵。例如,如果第一个特征是外点,而其它的特征是内点,那么 P j \pmb{P}_j PPPj为,
P j = P 1 = [ 1 0 0 0 1 0 0 0 1 0 0 0 ⋮ ⋮ ⋮ 0 0 0 ] (19) \pmb{P}_j=\pmb{P}_1=\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \\ \vdots & \vdots & \vdots \\ 0 & 0 & 0 \end{bmatrix} \tag{19} PPPj=PPP1=100000100000100(19)
由故障向量 f \pmb{f} fff引入的加权平方和残差 λ f \lambda_f λf可以计算为:
λ f = f T S f = f ∗ T P T S P f ∗ (20) \lambda_f=\pmb{f}^T\pmb{Sf}={\pmb{f}^*}^T\pmb{P}^T\pmb{SP}\pmb{f}^* \tag{20} λf=fffTSfSfSf=fffTPPPTSPSPSPfff(20)
其中,
S = W ( I − H ( H T W H ) − 1 H T W ) (21) \pmb{S}=\pmb{W}(\pmb{I}-\pmb{H}(\pmb{H}^T\pmb{WH})^{-1}\pmb{H}^T\pmb{W}) \tag{21} SSS=WWW(IIIHHH(HHHTWHWHWH)1HHHTWWW)(21)
根据公式(13),由故障向量 f \pmb{f} fff引入的定位解中的外点引起的误差的平方 ( ε f ) 2 (\varepsilon_f)^2 (εf)2也可以计算为,
( ε f ) 2 = f T D i f = f ∗ T P T D i P f ∗ (22) (\varepsilon_f)^2=\pmb{f}^T\pmb{D}_i\pmb{f}={\pmb{f}^*}^T\pmb{P}^T\pmb{D}_i\pmb{P}\pmb{f}^* \tag{22} (εf)2=fffTDDDifff=fffTPPPTDDDiPPPfff(22)
其中 D i \pmb{D}_i DDDi依赖于方向,假设位姿的前三个分量对应于位置部分,则计算方法如下:
D i = W H ( H T W H ) − 1 A i T A i ( H T W H ) − 1 H T W (23) \pmb{D}_i=\pmb{WH}(\pmb{H}^T\pmb{WH})^{-1}\pmb{A}_i^T\pmb{A}_i(\pmb{H}^T\pmb{WH})^{-1}\pmb{H}^T\pmb{W}\tag{23} DDDi=WHWHWH(HHHTWHWHWH)1AAAiTAAAi(HHHTWHWHWH)1HHHTWWW(23)
A 1 = [ 1 0 0 0 0 0 ] (24) \pmb{A}_1=\begin{bmatrix} 1 & 0 & 0 & 0 & 0 & 0 \end{bmatrix} \tag{24} AAA1=[100000](24)
A 2 = [ 0 1 0 0 0 0 ] (25) \pmb{A}_2=\begin{bmatrix} 0 & 1 & 0 & 0 & 0 & 0 \end{bmatrix} \tag{25} AAA2=[010000](25)
A 3 = [ 0 0 1 0 0 0 ] (26) \pmb{A}_3=\begin{bmatrix}0 & 0 & 1 & 0 & 0 & 0 \end{bmatrix} \tag{26} AAA3=[001000](26)
其中 i = 1 , 2 , 3 i=1,2,3 i=1,2,3分别指 x x x方向、 y y y方向和 z z z方向。从公式(22)中,我们发现向量 f \pmb{f} fff越大,定位解的误差就越大。但由于通过了外点排除检验, f ∗ T P T S P f ∗ {\pmb{f}^*}^T\pmb{P}^T\pmb{SP}\pmb{f}^* fffTPPPTSPSPSPfff的最大值被限制在小于 δ \delta δ的范围内。因此,由外点引入的向量 f ∗ \pmb{f}^* fff需要被分配,以使解中由外点引起的误差最大化,同时仍然满足 f ∗ T P T S P f ∗ = δ {\pmb{f}^*}^T\pmb{P}^T\pmb{SP}\pmb{f}^*=\delta fffTPPPTSPSPSPfff=δ的条件。保护水平所考虑的由外点诱发的误差的平方可通过求解优化问题来确定:
{ m a x f ∗ , P j ∈ P f ∗ T P j T D i P j f ∗ s . t .     f ∗ T P j T S P j f ∗ = δ (27) \begin{cases} \underset{f^*,P_j\in P}{max} {\pmb{f}^*}^T\pmb{P}_j^T\pmb{D}_i\pmb{P}_j\pmb{f}^* \\ s.t. \ \ \ {\pmb{f}^*}^T\pmb{P}_j^T\pmb{S}\pmb{P}_j\pmb{f}^*=\delta \end{cases} \tag{27} f,PjPmaxfffTPPPjTDDDiPPPjfffs.t.   fffTPPPjTSSSPPPjfff=δ(27)
根据参考文献[11],我们可以从方程中消去 f ∗ \pmb{f}^* fff,将约束优化问题简化为无约束优化问题,如下所示:
m a x P j ∈ P    Λ m a x ( D i , P j , S ) δ (28) \underset{P_j\in P}{max}\ \ \pmb{\Lambda}_{max}(\pmb{D}_i,\pmb{P}_j,\pmb{S})\delta \tag{28} PjPmax  ΛΛΛmax(DDDi,PPPj,SSS)δ(28)
其中 Λ m a x ( D i , P j , S ) \pmb{\Lambda}_{max}(\pmb{D}_i,\pmb{P}_j,\pmb{S}) ΛΛΛmax(DDDi,PPPj,SSS)是如下矩阵的最大特征值,
P j T D i P j ( P j T S P j ) − 1 (29) \pmb{P}_j^T\pmb{D}_i\pmb{P}_j(\pmb{P}_j^T\pmb{S}\pmb{P}_j)^{-1} \tag{29} PPPjTDDDiPPPj(PPPjTSSSPPPj)1(29)
我们可以遍历所有的特征,找到使得公式(28)最大的那个 P j \pmb{P}_j PPPj,其定义为:
P ∗ = a r g m a x P j ∈ P     Λ m a x ( D i , P j , S ) δ (30) \pmb{P}^*=\underset{P_j\in P}{argmax}\ \ \ \pmb{\Lambda}_{max}(\pmb{D}_i,\pmb{P}_j,\pmb{S})\delta \tag{30} PPP=PjPargmax   ΛΛΛmax(DDDi,PPPj,SSS)δ(30)
因此,考虑外点引起的误差的保护水平分量为,
ε f = Λ m a x ( D i , P ∗ , S ) δ (31) \varepsilon_f=\sqrt{\pmb{\Lambda}_{max}(\pmb{D}_i,\pmb{P}^*,\pmb{S})\delta} \tag{31} εf=ΛΛΛmax(DDDi,PPP,SSS)δ (31)
定位解中噪声引起的误差 ε n \varepsilon_n εn可以用下式来计算:
ε n = k [ ( H T W H ) − 1 ] i , i (32) \varepsilon_n=k\sqrt{[(\pmb{H}^T\pmb{WH})^{-1}]_{i,i}} \tag{32} εn=k[(HHHTWHWHWH)1]i,i (32)
其中 i = 1 , 2 , 3 i=1,2,3 i=1,2,3分别指 x x x方向、 y y y方向和 z z z方向。并且 k k k为指定检测概率 P d P_d Pd对应的标准差个数。在实际生活应用中, P d P_d Pd通常设置为99.73%,相应的 k = 3 k=3 k=3。结合外点引起的误差和噪声引起的误差,我们可以定义如下的视觉定位保护水平:
P L i = ε f + ε n = Λ m a x ( D i , P ∗ , S ) δ + k [ ( H T W H ) − 1 ] i , i (34) PL_i=\varepsilon_f+\varepsilon_n=\sqrt{\pmb{\Lambda}_{max}(\pmb{D}_i,\pmb{P}^*,\pmb{S})\delta}+k\sqrt{[(\pmb{H}^T\pmb{WH})^{-1}]_{i,i}} \tag{34} PLi=εf+εn=ΛΛΛmax(DDDi,PPP,SSS)δ +k[(HHHTWHWHWH)1]i,i (34)
其中 i = 1 , 2 , 3 i=1,2,3 i=1,2,3分别指 x x x方向、 y y y方向和 z z z方向。 P L x PL_x PLx P L y PL_y PLy P L z PL_z PLz分别等价于 P L 1 PL_1 PL1 P L 2 PL_2 PL2 P L 3 PL_3 PL3

5 性能评估

一个估计过程的最佳误差包络应该尽可能得紧,同时仍然在任何时候包络误差。然而,对于有外点的非线性系统,不可能保证所提出的包络在任何时候都能成功地包络住真实误差。目前还没有定量地评估潜在的误差包络性能的度量。因此,我们提出了一种新的松弛包络紧度(RBT)度量,用于定量地评估误差包络在假设误差服从高斯分布的应用中的性能。指标 Z \mathcal{Z} Z计算如下,
Z = ∑ i = 1 N ρ ( v i − e i σ i ) 2 N (35) \mathcal{Z}=\sqrt{\frac{\sum_{i=1}^N\rho(\frac{v_i-e_i}{\sigma_i})^2}{N}} \tag{35} Z=Ni=1Nρ(σiviei)2 (35)
其中 v i v_i vi e i e_i ei分别是对于样本 i i i的误差包络和误差, N N N是样本数量, σ i \sigma_i σi是给定样本的误差协方差, ρ \rho ρ是权重函数,定义如下:
ρ = { 1 v i ≥ e i τ v i < e i (36) \rho=\begin{cases} 1 & v_i\geq e_i \\ \tau&v_i<e_i \end{cases} \tag{36} ρ={1τvieivi<ei(36)
因为误差应该是一个上界,而不是对误差期望的预测,所以权重函数 ρ \rho ρ应该惩罚误差包络故障,而不是放松包络。系数 τ \tau τ决定了度量在多大程度上倾向于一个具有较高故障概率的紧密误差包络,而不是一个具有较低故障概率的保守包络,反之亦然,并取决于用户定义的检测概率 P d P_d Pd。这个概率 P d P_d Pd是该方法正确包络用户要求的误差的最小概率。

为了确定 τ \tau τ的值,我们假设误差服从无外点的高斯分布。设 Φ − 1 \Phi^{-1} Φ1为高斯分布的分位数函数,并定义理想的误差包络 v ∗ v^* v为,
v ∗ = Φ − 1 ( 1 − 1 − P d 2 ) (37) v^*=\Phi^{-1}(1-\frac{1-P_d}{2}) \tag{37} v=Φ1(121Pd)(37)
这个包络的选择与高斯分布的检测概率 P d P_d Pd的定义完全一致。给定包络 v ∗ v^* v,我们现在解出使度量 Z \mathcal{Z} Z最小化的 τ \tau τ值。请注意,在RBT度量中,由于我们用每个样本的协方差除以包络和真实误差的差, τ \tau τ的值与 σ i \sigma_i σi的值是独立的,因为假设误差服从高斯分布。

对于安全关键应用, P d P_d Pd应该定义为接近100%,这样这个度量更倾向于保守的方法,但能够在更高的时间百分比内正确地包络误差。对于安全性不那么重要的应用程序,可以不那么积极地定义 P d P_d Pd,这样度量就倾向于提供更紧密包络的方法,但可能在某些时候无法对误差进行包络。

6 实验结果

为了验证所提出的方法,并确定保护水平是否正确包络住了各方向上的平移误差,我们在著名的EuRoC数据集上对machine hall序列进行了实验。EuRoC数据集由微型飞行器(MAV)采集,利用Leica MS50激光跟踪器捕捉MAV在machine hall的真实位姿。

我们利用了ORB-SLAM2的定位模式,并添加了提出的外点剔除和保护水平计算模块。我们首先使用真实位姿来构建地图,然后使用ORB-SLAM2的定位模式和提出的完好性监测算法来获得对每帧的估计位姿和保护水平。对于基于双目视觉的定位,不需要初始化就可以恢复尺度。因此,在初始化之后,每个序列开始时MAV处于静止状态,我们开始估计。然后,将真值和估计的轨迹进行对齐,并对误差进行评估。最后,我们将各方向的保护水平和 3 σ 3\sigma 3σ包络与每帧的真实平移误差进行比较。

在本实验中,我们设虚警概率 P f a P_{fa} Pfa为0.05,设公式(32)中的 k k k为3,这是机器人应用的典型值。在ORB-SLAM2中,每个特征的协方差矩阵 Q j \pmb{Q}_j QQQj与提取关键点时的尺度相关。因为ORB-SLAM2是一种仅基于视觉的SLAM算法,所以决定它们在确定相机位姿时重要性的是特征的协方差之间的相对值,而不是协方差的绝对值。首先,我们使用默认的ORB-SLAM2协方差来进行实验,该协方差被设置为1像素,用于在基本尺度级别中检测到的特征。图1显示了利用1像素假设,MH_01_easy整个轨迹的 z z z方向上的保护水平、 3 σ 3\sigma 3σ包络和真实误差。结果表明,保护水平能够包络95%以上的帧,而 3 σ 3\sigma 3σ只能包络50%左右的帧。 3 σ 3\sigma 3σ包络的这种惨烈失败的可能原因是,首先,在这些帧中, 3 σ 3\sigma 3σ没有包络误差,其次,测量模型上的内点测量噪声的协方差设置得过小。为了避免第二种情况,我们在假设了1、1.5和2像素协方差的基础尺度水平上进行实验。这些是用于相机测量模型的协方差的典型值。

在这里插入图片描述

图1 利用1像素协方差假设,对EuRoC数据集中的MH_easy_01序列计算z方向的保护水平、3sigma和误差。3sigma方法的包络范围仅在54%左右,保护水平的包络范围在95%以上。

在图2中,通过绘制在不同的测量协方差假设下误差包络与真实误差的差值在 x x x方向上的累积分布,我们比较了保护水平方法和 3 σ 3\sigma 3σ方法。理想的误差包络将完全包含 x x x正半轴,因为我们希望误差包络能够包络真正的误差,以及分布尽可能接近于0,因为我们希望误差包络一定会尽可能的紧密。曲线与垂直线 x = 0 x=0 x=0之间的交点给出了误差包络方法未能包络误差的帧数百分比。正如预期的那样,与 3 σ 3\sigma 3σ相比,保护水平提供了一个更保守的误差包络,但能够以更高的百分比包络误差。如果我们使用存在1个像素的假设,这是ORB-SLAM2中默认的协方差值,我们发现 3 σ 3\sigma 3σ只能以较低的比例包络 x x x方向上误差,分别是MH_01_easy的35%,MH_02_easy的54%,MH_03_medium的22%,MH_04_difficult的43%和MH_05_difficult的45%。然而,在MH_03_medium中,保护水平能够以85%左右的比例包络误差,其余序列的在95%左右。如果我们使用1.5像素和2像素假设, 3 σ 3\sigma 3σ方法能够在一个很高百分比的情况下正确包络误差,但仍然明显低于保护水平方法。保护水平方法对于MH_03_medium约为95%,对于其余的接近100%。类似的结果也适用于 y y y方向和 z z z方向。

在这里插入图片描述

图2 EuRoC数据集中machine hall序列的误差包络和误差的差值的累积分布图。与3sigma方法相比,该保护水平方法以较高的比例正确地包络了所有序列的误差。

我们还将提出的保护水平与 3 σ 3\sigma 3σ方法进行了比较,使用第5节中提出的度量。我们将 P d P_d Pd参数设置为99.73%,因为这是现实生活中最常用的检测概率之一,也与用于比较的 3 σ 3\sigma 3σ包络相对应。由于我们利用高斯分布确定了度量中的惩罚系数 τ \tau τ,并选择 P d P_d Pd为99.73%,因此如果误差真正遵循零均值高斯分布,则度量更倾向于 3 σ 3\sigma 3σ方法。然而,从表1中可以发现,在所有3个协方差假设下,提出的保护水平在所有序列都优于 3 σ 3\sigma 3σ方法。结果表明,基于特征的视觉测量容易产生误差,因此位置解的误差并不完全服从高斯分布。此外,该方法能够正确地将误差包络在较高的百分比上,并在所选的度量上优于 3 σ 3\sigma 3σ

表1 使用提出的RBT指标的性能比较

在这里插入图片描述
对于MH_03_medium序列,保护水平和 3 σ 3\sigma 3σ的结果均明显低,因为该序列获得的真实误差明显大于其它序列。假设地图上的点可能包含这个序列的一些误差。为了验证这个假设,我们执行实验,使用由ORB-SLAM2的SLAM模式构建的地图,而不是由地面真值构造的地图,并评估相对于SLAM模式的定位解,而不是地面真值,这消除了解中地图的误差。对于MH_03_medium系列,我们发现在这种情况下,平移的RSME为0.011米,远小于使用地面真值获得的0.032米。在1像素、1.5像素和2像素的假设下, x x x方向上的保护水平的性能分别为17.8、18.4和18.7,而 3 σ 3\sigma 3σ方法的性能分别为90.0、43.2和23.2。在使用提出的RBT度量下,保护水平仍然优于 3 σ 3\sigma 3σ方法。这同样适用于其它两个方向和其它序列。

我们注意到,虽然保护水平能够更好地包络误差,但与 3 σ 3\sigma 3σ相比,它产生的误差包络较松散。潜在的问题是,在操作期间,它可能会导致更多的误报警。我们认为,误差包络的选择应取决于应用的安全标准,所提出的保护水平更适合生命安全关键应用。

7 结论及未来工作

本文提出了一种完好性监测算法来估计视觉定位解中最大可能的平移误差。该框架受到RAIM的启发,我们并进行了修改,以适应视觉定位问题的表述。它首先基于奇偶空间法来检测外点,然后计算外点检测算法不期望检测到的最大可能误差。此外,我们还提出了一种松弛包络紧密度来定量地评估误差包络的性能。最后,通过在EuRoC数据集上进行实验,并使用所提出的度量对结果进行评估,结果表明所提出的保护水平比典型的 3 σ 3\sigma 3σ方法产生了更可靠的包络,并为评估方案的完好性提供了一种方法。未来的工作将包络在计算保护水平时考虑地图的不确定性和可能不正确的特征协方差,以及进一步发展为视觉里程计提供完好性监测的概念。

8 参考文献

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YMWM_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值