《视觉SLAM十四讲第二版》笔记及课后习题（第八讲）

最新推荐文章于 2024-08-08 14:12:53 发布

nullwh

最新推荐文章于 2024-08-08 14:12:53 发布

阅读量3.2k

点赞数 6

分类专栏：视觉SLAM十四讲学习笔记

本文链接：https://blog.csdn.net/weixin_43619346/article/details/103218214

版权

本文是《视觉SLAM十四讲》第二版的读书笔记，主要探讨了直接法与光流在视觉里程计中的应用。直接法通过最小化光度误差求解相机运动，克服了特征点法的计算耗时和信息利用率低的问题。光流是直接法的基础，用于跟踪像素运动。直接法分为稀疏、半稠密和稠密三种形式，适用于不同计算资源和应用场景。文章还讨论了直接法的优缺点，以及在光照变化和非凸性问题上的挑战，并提出了光流的其他方法和增强直接法鲁棒性的方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

读书笔记：视觉里程计2

直接法是视觉里程计另一主要分支，它与特征点法有很大不同。虽然它还没有成为现在VO 中的主流，但经过近几年的发展，直接法在一定程度上已经能和特征点法平分秋色。

直接法的引出

上一讲我们介绍了使用特征点估计相机运动的方法。尽管特征点法在视觉里程计中占据主流地位，研究者们认识到它至少有以下几个缺点：

关键点的提取与描述子的计算非常耗时。实践当中，SIFT 目前在CPU 上是无法实时计算的，而ORB 也需要近20 毫秒的计算。如果整个SLAM 以30 毫秒/帧的速度运行，那么一大半时间都花在计算特征点上。
使用特征点时，忽略了除特征点以外的所有信息。一张图像有几十万个像素，而特征点只有几百个。只使用特征点丢弃了大部分可能有用的图像信息。
相机有时会运动到特征缺失的地方，往往这些地方没有明显的纹理信息。例如，有时我们会面对一堵白墙，或者一个空荡荡的走廓。这些场景下特征点数量会明显减少，我们可能找不到足够的匹配点来计算相机运动。

我们看到使用特征点确实存在一些问题。有没有什么办法能够克服这些缺点呢？我们有以下几种思路：
• 保留特征点，但只计算关键点，不计算描述子。同时，使用光流法（Optical Flow）来跟踪特征点的运动。这样可以回避计算和匹配描述子带来的时间，但光流本身的计算需要一定时间；
• 只计算关键点，不计算描述子。同时，使用直接法（Direct Method）来计算特征点在下一时刻图像的位置。这同样可以跳过描述子的计算过程，而且直接法的计算更加简单。
• 既不计算关键点、也不计算描述子，而是根据像素灰度的差异，直接计算相机运动。

第一种方法仍然使用特征点，只是把匹配描述子替换成了光流跟踪，估计相机运动时仍使用对极几何、PnP 或ICP 算法。而在后两个方法中，我们会根据图像的像素灰度信息来计算相机运动，它们都称为直接法。

使用特征点法估计相机运动时，我们把特征点看作固定在三维空间的不动点。根据它们在相机中的投影位置，通过最小化重投影误差（Reprojection error）来优化相机运动。在这个过程中，我们需要精确地知道空间点在两个相机中投影后的像素位置——这也就是我们为何要对特征进行匹配或跟踪的理由。同时，我们也知道，计算、匹配特征需要付出大量的计算量。相对的，在直接法中，我们并不需要知道点与点之间之间的对应关系，而是通过最小化光度误差（Photometric error）来求得它们。

光流（Optical Flow）

直接法是从光流演变而来的。它们非常相似，具有相同的假设条件。光流描述了像素在图像中的运动，而直接法则附带着一个相机运动模型。为了说明直接法，我们先来介绍一下光流。
光流是一种描述像素随着时间，在图像之间运动的方法，如下图所示。随着时间的经过，同一个像素会在图像中运动，而我们希望追踪它的运动过程。计算部分像素运动的称为稀疏光流，计算所有像素的称为稠密光流。稀疏光流以Lucas-Kanade 光流为代表，并可以在SLAM 中用于跟踪特征点位置。因此，本节主要介绍Lucas-Kanade 光流，亦称LK光流。

在这里插入图片描述