视觉SLAM十四讲——ch3回顾与总结(三维刚体运动)


写在最前面:
在学习之前首先感谢b站博主lessLe6,小姐姐讲的十分容易理解。

首先了解坐标的变换,因此有了矩阵帮助理解,但是由于矩阵太过冗余因此提出了旋转向量;又因为旋转向量不直观,故有了欧拉角;但是欧拉角又存在万向锁的情况会导致奇异性,因此便有了四元数
在视觉SLAM中,我们用的也是四元数。

0. 部分基础知识

在学习之前最好已经有一些数学基础,这是我的一些总结:https://blog.csdn.net/qq_44164791/article/details/131503895?spm=1001.2014.3001.5501
除此之外,还有一些与视觉SLAM有关的基础知识在下面列举

0.1 概括

  1. 三维空间是由3个轴组成,则一个空间点的位置可以由3个坐标确定,也就是任何一个点都存在于我们的三维坐标系中。
  2. 我们的研究主要是针对于刚体,对于一个刚体,不仅有位置,还有自身的姿态。相机可以看成三维空间中的刚体,则位置就是说相机在空间中的哪个地方,姿态是指相机的朝向(例:相机处于空间(0,0,0)处,朝向正前方)
    说明:

刚体: 在运动和受力作用后,形状和大小不变,而且内部各点的相对位置不变的物体

0.2 数学语言

如果想用数学语言对我们的概括进行描述的话,首先我们需要知道几个概念:

点: 没有长度和体积
向量: 带指向性的箭头
坐标: 可以理解为位置
坐标系: 构成线性空间的一组基,分为左手系和右手系

在视觉SLAM中,我们将相机视为点,SLAM是实时定位与建图,在这个过程中,相机肯定是运动的,运动就会有变化,此时我们就将相机的运动用向量表示;为了有更好的数学对其进行量化,我们将相机放入世界坐标系中,就可以得到相机在世界坐标中的坐标,就可以进一步用数学语言描述相机的变化。

0.3 提到的一些知识

在这里插入图片描述
在这里插入图片描述
到目前为止就可以正式学习啦

1. 旋转矩阵R和变换矩阵T

之所以会提出来这两个矩阵,是因为我们将相机视为一个点,它存在于世界坐标系中。但是我们SLAM的完整功能的实现,需要将相机拍摄到的图片进行处理。因此就涉及到相机坐标系了,然而世界坐标系和相机坐标系是不同的坐标系,于是就有了世界坐标系和相机坐标系如何进行转换的问题。我们将这个变换称为欧氏变换
在这里插入图片描述
欧氏变换时由旋转和平移组成。先讨论旋转再讨论平移,这里利用单位正交基来表示坐标系。

1. 旋转

假设: 某坐标系 ( e 1 , e 2 , e 3 ) (e_1,e_2,e_3) (e1,e2,e3),经过一次旋转后变成了 ( e 1 ′ , e 2 ′ , e 3 ′ ) (e^{'}_1,e^{'}_2,e^{'}_3) (e1,e2,e3)
对于一个固定的 a ⃗ \vec{a} a ,我们探讨它的坐标如何变化。(注: 这里的固定指的是向量本身的长度方向不变)
由于旋转前后向量是固定不变的,因此有:
在这里插入图片描述
左乘初始坐标系的转置,则有:
在这里插入图片描述
上式中的3×3矩阵记为 R R R,我们称为旋转矩阵。旋转矩阵是一个正交矩阵而且其行列式为+1或者-1 可以利用旋转矩阵描述两个坐标的变换

  1. a ⃗ 1 = R 12 a ⃗ 2 \vec{a}_1 = R_{12}\vec{a}_2 a 1=R12a 2说的是由坐标系2变换到坐标系1
  2. a ⃗ 2 = R 21 a ⃗ 1 \vec{a}_2 = R_{21}\vec{a}_1 a 2=R21a 1说的是由坐标系1变换到坐标系2
  3. 由1、2可得 R 21 = R 21 − 1 = R 12 T R_{21}=R^{-1}_{21}=R^{T}_{12} R21=R211=R12T

此时,我们只描述了旋转,再加上平移的话就可以完全描述两个坐标系的刚体运动了。
加上平移之后:
a ′ = R a + t a' = Ra + t a=Ra+t

1.2 变换矩阵

现在出现一个问题就是当连续变动坐标系的时候,狮子就会变得很复杂,比如说: c = R 1 a + t 1 , c = R 2 b + t 2 c=R_1a+t_1,c=R_2b+t_2 c=R1a+t1,c=R2b+t2 a a a c c c就成了 c = R 2 ( R 1 a + t 1 ) + t 2 c=R_2(R_1a+t_1)+t_2 c=R2(R1a+t1)+t2,这样看起来就很复杂,此时,我们可以将旋转和平移结合,给它增加一个维度,如下所示:
在这里插入图片描述
这样就可以得到以下式子:
在这里插入图片描述
通过将旋转和平移放在同一个矩阵中,得出变换矩阵,同样的也可以进行反向变换,即:
在这里插入图片描述
总的来说

  1. 三维的旋转矩阵有九个量,但一次旋转只有三个自由度。因此这种表达方式是冗余的。
  2. 而且旋转矩阵自身带有约束:它必须是个正交矩阵,且行列式为1。变换矩阵也是如此。当我们想要估计或优化一个旋转矩阵°变换矩阵时,这些约束会使得求解变得更困难。
    那么,接下啦就要探究更紧凑的表示

2. 旋转向量

3. 欧拉角

4. 四元数

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《视觉SLAM十四》第三章主要介绍了视觉SLAM中的关键技术——特征提取和描述子。本章首先介绍了特征点的概念和特征点的选择原则。特征点即图像中具有鲁棒性和区分度的点,可以通过对其进行检测和描述来进行特征匹配和跟踪。在进行特征提取时,作者介绍了常见的特征检测算法,如Harris角点检测、SIFT和SURF算法等,并对其进行了比较和分析。 接着,本章详细阐述了特征描述子的概念和作用。特征描述子是对特征点周围区域的图像信息进行编码,以实现特征匹配和跟踪。常见的特征描述子包括SIFT、SURF和ORB等。作者从描述子的表示形式、计算方式和匹配方法等方面进行了介绍,并对它们进行了比较和评价。同时,还提到了基于二进制描述子的方法,如BRIEF、BRISK和FREAK等。 在特征匹配方面,本章介绍了特征描述子匹配的基本原理和流程。以基于特征点的视觉SLAM为例,作者详细解释了特征点的匹配过程,包括特征点的选择、特征点描述子匹配和筛选等步骤。并介绍了如何通过验证特征点的三角化和PnP求解来估计相机的位姿。 此外,本章还介绍了一些特定场景下的特征点选择和提取策略,如动态环境下的特征点追踪和关键帧选择等。 综上所述,《视觉SLAM十四》第三章主要介绍了特征提取和描述子在视觉SLAM中的重要性和应用。通过对特征点的检测和描述,可以实现特征匹配和跟踪,为后续的相机位姿估计和建图提供基础。该章内容详细且通俗易懂,对于学习和理解视觉SLAM有着重要的指导作用。 ### 回答2: 《视觉SLAM十四-Ch3》主要介绍了视觉SLAM(同时定位与建图)技术的基本原理和实现方法。本章主要涵盖了三维几何表示和变换、相机模型和相机姿态以及特征提取与匹配等内容。 首先,本章介绍了三维几何表示和变换的概念。通过介绍欧氏空间中的点、向量和坐标变换,深入解释了相机在三维空间中的位置和朝向的表示方式。同时,引入了齐次坐标和投影矩阵的概念,为后续的相机模型和姿态估计打下了基础。 其次,本章详细解了相机模型和相机姿态的原理与应用。其中,介绍了针孔相机模型,分析了图像坐标和相机坐标之间的映射关系。通过投影矩阵的推导,给出了透视投影和仿射投影的公式,并解释了相机焦距和主点的含义。此外,还介绍了如何通过计算相机的外参矩阵来估计相机的姿态,以及如何将图像坐标转换为相机坐标。 最后,本章介绍了特征提取与匹配的技术。首先,介绍了角点和边缘点的概念,以及如何利用差分和梯度计算来检测图像中的角点和边缘点。然后,介绍了如何通过特征描述符来表示图像中的特征点,并通过特征匹配算法找到两幅图像之间的对应关系。特征提取与匹配是视觉SLAM中非常重要的步骤,对于后续的相机定位和建图至关重要。 综上所述,《视觉SLAM十四-Ch3》通过系统地介绍了视觉SLAM技术的基本概念和实现方法,包括三维几何表示和变换、相机模型和相机姿态的原理与应用,以及特征提取与匹配的技术。这些内容为读者深入理解和掌握SLAM技术提供了很好的基础。 ### 回答3: 视觉SLAM(Simultaneous Localization and Mapping)是一种通过计算机视觉技术,实现机器智能的同时实时定位和地图构建的方法。在《视觉SLAM十四》第三中,主要介绍了视觉SLAM的基本概念和关键技术。 首先,解了视觉SLAM的理论基础,包括自我运动估计和地图构建两个部分。自我运动估计是通过相邻帧之间的视觉信息,计算相机在三维空间中的运动,从而实现机器的实时定位;地图构建是通过对场景中特征点的观测和跟踪,建立起一个三维空间中的地图。这两个过程相互影响,通过不断迭代优化,实现高精度的定位和地图构建。 接着,解了基于特征的视觉SLAM算法。特征提取与描述是建立视觉SLAM系统的关键步骤,通过提取场景中的特征点,并为其生成描述子,来实现特征点的匹配和跟踪。同时,还介绍了一些常用的特征点提取和匹配算法,如FAST、SIFT等。 在SLAM框架方面,本节还介绍了基于视觉的前端和后端优化。前端主要负责实时的特征跟踪和估计相机运动,后端则是通过优化技术,对前端输出的轨迹和地图进行优化求解,从而提高系统的精度和鲁棒性。 最后,本节提到了几个视觉SLAM的应用场景,如自主导航、增强现实等。这些应用对于实时高精度的定位和地图建立都有着很高的要求,因此,视觉SLAM的技术在这些领域有着广泛的应用前景。 总的来说,《视觉SLAM十四》第三视觉SLAM的基本概念和关键技术进行了系统的介绍。理论基础、特征提取与描述、SLAM框架和应用场景等方面的内容都给出了详细的解释和案例,有助于读者更好地理解和应用视觉SLAM技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值