Comparing ORB and AKAZE for visual odometryof unmanned aerial vehicles 论文翻译

直接呈现本文的结论:ORB 的计算速度比 AKAZE 更快,并且 AKAZE 的处理时间随着图像分辨率的增加而迅速增加。 然而,在过滤匹配并去除异常值后,AKAZE 呈现出比 ORB 更多的正确匹配。尽管 ORB 的计算速度更快,这在实时应用中是理想的,但对于低分辨率(通常为 640x480 像素)的图像,AKAZE 在速度和性能之间表现出比 ORB 更好的折衷。 在本文中,比较了 ORB 和 AKAZE 在无人机机载摄像头捕获的图像上的性能。 

摘要

        为了实现自主导航,无人驾驶飞行器(也称为无人机)必须能够在飞行过程中估计其位置。这通常通过使用结合惯性测量单元的全球定位系统来实现。尽管广泛用于此目的,GPS 也有一些缺点,例如存在 GPS 拒绝的杂乱环境。规避此问题的一种方法是采用视觉里程计技术和基于特征的方法来计算飞机运动,从而进行位置估计。我们使用了两个最近的特征检测器和描述符——ORB 和 AKAZE——并比较了它们的准确性和处理时间。目的是评估它们在无人机实时嵌入式系统中对视觉里程计任务的适用性。我们得出的结论是,尽管 ORB 的计算速度更快,但对于低分辨率图像,AKAZE 在速度和性能之间表现出比 ORB 更好的折衷。

关键词:ORB、AKAZE、UAV、视觉里程计、特征匹配。

1.简介

        近年来,无人驾驶飞行器(UAV)(也称为无人机)的开发和使用有了长足的发展。 嵌入在无人机中的传感器的数量和质量也有所提高,尤其是摄像头。 无人机有各种有用的应用,包括:农业、牲畜和环境监测; 安全和监视; 搜索和救援; 娱乐; 其中。

        在几种情况下,需要自主导航能力。 为此,无人机嵌入式系统必须知道飞机的位置。 这些信息通常由一些全球系统导航卫星 (GNSS) 获得,其中最常用的是全球定位系统 (GPS) - 结合惯性导航系统 (INS)。 尽管广泛用于此目的,GPS 也有一些缺点,例如存在 GPS 拒绝的杂乱环境。 规避此问题的一种方法是使用计算机视觉技术并从嵌入式相机中提取信息。 收集的图像用于计算 UAV 位移并估计其在飞行过程中的位置,这称为视觉里程计。

        特征选择和匹配是视觉里程计的重要步骤。 文献中有几种点特征检测器和描述符可用,但其中许多依赖于昂贵的描述符进行检测和匹配,这使得它们的使用对于实时目的来说是不切实际的。 一些最流行的特征描述符是 SIFT [2] 和 SURF [3]。 但是,在过去几年中,出现了新的描述符,它们的计算速度要快得多,或者比 SIFT 和 SURF 更准确。 在本文中,我们将处理其中的两个:ORB [4] 和 AKAZE [5]。

        ORB(Oriented FAST and Rotated Brief)是一种快速二进制描述符,基于 FAST(来自加速段测试的特征)关键点检测器 [6]、[7] 和 Brief(二进制鲁棒独立基本特征)描述符 [8] 的组合 . 它是旋转不变的并且对噪声具有鲁棒性。 另一方面,AKAZE (Accelerated-KAZE) 是 KAZE [9] 的加速版本,提出了一种用于非线性尺度空间的快速多尺度特征检测和描述方法。 它是尺度和旋转不变的。

        在本文中,我们比较了 ORB 和 AKAZE 的结果,了解它们在识别特征点方面的准确性以及它们的处理时间。 这种比较的重要性源于应用算法的目标,该算法在实时应用所需的良好性能和视觉里程计任务所需的准确性之间取得折衷。

2.Visual Odometry

        视觉里程计 (VO) 是使用单个或多个嵌入式摄像机的输入来估计代理(例如车辆、人类和机器人)的自我运动的过程 [1]。 对于空中导航,无人机应使用其机载摄像头捕捉连续的图像帧。 应确保足够的场景重叠,以便 VO 可以通过评估车辆运动在图像上引起的变化来逐步估计车辆的位置。 VO 系统与惯性测量单元 (IMU) 一起工作,允许无人机导航,而不受 GPS 等其他导航系统的影响。 图 1 显示了一个无人机摄像头拍摄的连续图像示例。

Figure 1 - Examples of consecutive images captured by an UA V camera.

3.Feature Extraction and Matching

为了在图像中找到特征点及其对应关系,必须在连续图像中独立检测特征并进行匹配。 这种匹配基于图像描述符之间的一些相似性度量。 该方法适用于有较大运动和视点变化的无人机位置估计和导航。 这个过程可以分为三个主要步骤,如下所示:

3.1 Feature Detection

在此步骤中,在图像中搜索显着关键点作为局部特征。 显着关键点是图像中在强度、颜色和纹理方面与其直接邻域不同的图案。 一个好的特征检测器的一些属性是[1]:

• 定位精度——位置和比例;

• 可重复性——重新检测下一张图像中的大量特征;

• 计算效率;

• 鲁棒性——对噪声、压缩伪影、模糊等;

• 独特性——不同图像之间的准确匹配; 和

• 不变性——对照明、旋转、比例、透视失真。

        在 ORB 中,检测步骤基于 FAST 关键点检测器,由于其计算特性,它是一种适用于实时应用的高效角点检测器。 由于 FAST 不包括方向算子,ORB 向其添加了一个方向分量,如 [4] 中所述,称为 oFAST(面向 FAST)。

        AKAZE 利用嵌入金字塔框架中的快速显式扩散 (FED) 方案 [10] 来在非线性尺度空间中构建加速特征检测。 通过 FED 方案,可以比任何其他类型的离散化方案 [9] 更快地构建非线性尺度空间。

3.2 Feature Description

        在这一步中,每个检测到的特征周围的区域都被转换为一个紧凑的描述符,可以使用一些相似性或距离度量与其他特征进行匹配。特征描述符的一个简单示例是特征点周围块中像素的强度,它表示其外观。然而,特征的局部外观并不是一个好的描述符,因为它可能会因方向、比例和视点变化而发生变化。

        ORB 执行的特征描述基于BRIEF 描述符,它在平滑图像块中的像素之间使用简单的二进制测试。它对光照和透视失真很鲁棒,但对平面内旋转非常敏感。为了规避这个问题,ORB 使用 oF AST 获得的关键点方向信息来计算有方向的 Brief 特征,然后使用学习方法找到相关性较低的二进制测试并从中选择一个好的子集。这会在最近邻应用程序中带来更好的性能。这个生成的描述符被命名为 rBRIEF(旋转的 Brief)。

        AKAZE 执行的特征描述基于 LDB(局部差分二进制)描述符 [11],它遵循与 Brief 相同的原理。 [5] 提出了 LDB 的一种修改,即所谓的 M-LDB(ModifiedLocal Difference Binary),它利用来自非线性尺度空间的梯度和强度信息。他们的修改包括对网格进行二次采样,而不是使用网格每个细分内所有像素的平均值。这是在作为特征尺度函数的步骤中执行的,因此与尺度相关的采样使描述符对尺度变化具有鲁棒性。

3.3 Feature Matching

此步骤使用相似度或距离度量来执行两个连续图像的特征之间的匹配,以比较它们的特征描述符并选择最佳对应关系。 由于 ORB 和 AKAZE 都使用二进制描述符,它们都使用汉明距离来有效地计算匹配。

4.Experiments

实验使用两个不同的航拍图像数据库进行:

• 第一个包含一组 1098 张图像(7360x4912 像素),从固定翼无人机机载的 SONY ILCE-7R 相机获得,焦距为 45mm 在农村地区上空平均飞行高度为 360m。

• 第二组由 148 张图像(4000x3000 像素)组成,由佳能 PowerShot S110 相机获得,焦距为 5.2mm,机载四旋翼飞行器 (b),平均高度为 28m,在城市区域上空飞行 地标。

        图 2 显示了来自第一个数据集的农村地区图像示例。 来自第二个数据集的图像示例如图 1 所示。

        检测到和匹配的特征的数量对算法的性能有直接影响,因此,在我们的实验中,两个数据集中使用的图像被调整为 736x491 和 640x480,以便进行实时处理。

        表 1 显示了 ORB 和 AKAZE 的两个连续图像之间匹配的平均关键点数。 由于 ORB 发现了更多的关键点,其定义要保留的最大特征数的参数分别设置为数据集 1 和 2 的 1518 和 1780,以保持检测到的特征的大致相同数量的平均值并促进 比较。 表 2 显示了算法的处理时间。

        由于每个图像中的关键点都是独立检测的,因此特征匹配步骤会产生很多不正确的匹配。 因此,我们使用 RANSAC [12] 来消除大量异常值。 表 3 描述了应用 RANSAC 后数据集 1 的平均正确匹配率(它们的准确性),表 4 提供了关于数据集 2 的相同信息。图 3 说明了图 1 中相同图像的特征匹配和异常值去除步骤, 用圆圈表示特征检测和描述步骤中生成的关键点,以及连接匹配关键点的线。

结论

        从表 2 中可以看出,ORB 的计算速度比 AKAZE 更快,并且 AKAZE 的处理时间随着图像分辨率的增加而迅速增加。 然而,在过滤匹配并去除异常值后,AKAZE 呈现出比 ORB 更多的正确匹配,这可以在表 3 和表 4 中观察到。对于由农村图像组成的数据集 1,ORB 的Inliers绝对数量有所下降。 我们可以得出结论,尽管 ORB 的计算速度更快,这在实时应用中是理想的,但对于低分辨率(通常为 640x480 像素)的图像,AKAZE 在速度和性能之间表现出比 ORB 更好的折衷。 在本文中,我们比较了 ORB 和 AKAZE 在无人机机载摄像头捕获的图像上的性能。 在未来的工作中,我们打算在真实的视觉里程计应用程序中对其进行验证,以显示它们对 UA Vs 位置估计准确性的影响。

AKAZE (Accelerated-KAZE) 是 KAZE [9] 的加速版本,提出了一种用于非线性尺度空间的快速多尺度特征检测和描述方法。 它是尺度和旋转不变的

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值