《视觉slam十四讲》之第7讲-2D-2D配准

 

2D-2D:对极几何

当相机为单目时,我们只知道 2D 的像素坐标,因而问题是根据两组 2D 点估计运动。

对极约束

P 的空间位置为:

两个像素点 p1; p2 的像素位置为:

 

把上式写成在乘以非零常数下成立的( upto a scale)等式:

 

取:

这里的 x1; x2 是两个像素点的归一化平面上的坐标。代入上式,得:

两边同时左乘 t^。

然后,两侧同时左乘 xT2

 

t^x2 是一个与 t 和 x2 都垂直的向量。把它再和 x2 做内积时,将得到 0。

代入 p1; p2,有:

这两个式子都称为对极约束

基础矩阵( Fundamental Matrix) F 和本质矩阵( Essential Matrix) E。

于是,相机位姿估计问题变为以下两步:

1. 根据配对点的像素位置,求出 E 或者 F;

2. 根据 E 或者 F,求出 R; t。由于 E 和 F 只相差了相机内参,而内参在 SLAM 中通常是已知的,所以实践当中往往使用形式更简单的 E。

本质矩阵

  • 本质矩阵是由对极约束定义的。由于对极约束是等式为零的约束,所以对 E 乘以任意非零常数后, 对极约束依然满足。我们把这件事情称为 E 在不同尺度下是等价的
  • 根据 E = t^R,可以证明 [3],本质矩阵 E 的奇异值必定是 [σ; σ; 0]T 的形式。这称为本质矩阵的内在性质
  • 另一方面,由于平移和旋转各有三个自由度,故 t^R 共有六个自由度。但由于尺度等价性,故 E 实际上有五个自由度

E 具有五个自由度的事实,表明我们最少可以用五对点来求解 E。但是, E 的内在性质是一种非线性性质,在求解线性方程时会带来麻烦,因此,也可以只考虑它的尺度等价性,使用八对点来估计 E——这就是经典的八点法( Eight-point-algorithm);

考虑一对匹配点,它们的归一化坐标为: x1 = [u1; v1; 1]T , x2 = [u2; v2; 1]T。根据对极约束,有:

对极约束可以写成与 e 有关的线性形式:

如果八对匹配点组成的矩阵满足秩为 8 的条件,那么 E 的各元素就可由上述方程解得。

奇异值分解

设 E 的 SVD 分解为:

其中 U; V 为正交阵, Σ 为奇异值矩阵。根据 E 的内在性质,我们知道 Σ = diag(σ; σ; 0)。

在 SVD 分解中,对于任意一个 E,存在两个可能的 t; R 与它对应:

从 E 分解到 t; R 时,一共存在四个可能的解

 

只有一种解, P 在两个相机中都具有正的深度。因此,只要把任意一点代入四种解中,检测该点在两个相机下的深度,就可以确定哪个解是正确的了。

注意: 

根据线性方程解出的 E,可能不满足 E 的内在性质——它的奇异值不一定为 σ; σ; 0 的形式。这时,在做 SVD 时,我们会刻意地把 Σ 矩阵调整成上面的样子。

通常的做法是,对八点法求得的 E 进行 SVD 分解后,会得到奇异值矩阵Σ = diag(σ1; σ2; σ3),不妨设 σ1 ≥ σ2 ≥ σ3。取:

单应矩阵

单应矩阵( Homography) H 的东西,它描述了两个平面之间的映射关系。若场景中的特征点都落在同一平面上(比如墙,地面等),则可以通过单应性来进行运动估计。这种情况在无人机携带的俯视相机,或扫地机携带的顶视相机中比较常见。
单应矩阵通常描述处于共同平面上的一些点,设这个平面满足方程:

整理,得:

推导:

我们得到了一个直接描述图像坐标 p1 和 p2 之间的变换,把中间这部分记为H,于是

展开得:

我们在实际处理中,通常乘以一个非零因子使得 h9 = 1(在它取非零值时)。然后根据第三行,去掉这个非零因子,于是有:

整理得:

是自由度为 8 的单应矩阵可以通过 4 对匹配特征点算出:

单应性在 SLAM 中具重要意义。当特征点共面,或者相机发生纯旋转的时候,基础矩阵的自由度下降,这就出现了所谓的退化( degenerate)。

现实中的数据总包含一些噪声这时候如果我们继续使用八点法求解基础矩阵,基础矩阵多余出来的自由度将会主要由噪声决定。

为了能够避免退化现象造成的影响,通常我们会同时估计基础矩阵 F 和单应矩阵H,选择重投影误差比较小的那个作为最终的运动估计矩阵

 

 

 



 

转载于:https://www.cnblogs.com/ChrisCoder/p/10035562.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《视觉SLAM十四》第三章主要介绍了视觉SLAM中的关键技术——特征提取和描述子。本章首先介绍了特征点的概念和特征点的选择原则。特征点即图像中具有鲁棒性和区分度的点,可以通过对其进行检测和描述来进行特征匹配和跟踪。在进行特征提取时,作者介绍了常见的特征检测算法,如Harris角点检测、SIFT和SURF算法等,并对其进行了比较和分析。 接着,本章详细阐述了特征描述子的概念和作用。特征描述子是对特征点周围区域的图像信息进行编码,以实现特征匹配和跟踪。常见的特征描述子包括SIFT、SURF和ORB等。作者从描述子的表示形式、计算方式和匹配方法等方面进行了介绍,并对它们进行了比较和评价。同时,还提到了基于二进制描述子的方法,如BRIEF、BRISK和FREAK等。 在特征匹配方面,本章介绍了特征描述子匹配的基本原理和流程。以基于特征点的视觉SLAM为例,作者详细解释了特征点的匹配过程,包括特征点的选择、特征点描述子匹配和筛选等步骤。并介绍了如何通过验证特征点的三角化和PnP求解来估计相机的位姿。 此外,本章还介绍了一些特定场景下的特征点选择和提取策略,如动态环境下的特征点追踪和关键帧选择等。 综上所述,《视觉SLAM十四》第三章主要介绍了特征提取和描述子在视觉SLAM中的重要性和应用。通过对特征点的检测和描述,可以实现特征匹配和跟踪,为后续的相机位姿估计和建图提供基础。该章内容详细且通俗易懂,对于学习和理解视觉SLAM有着重要的指导作用。 ### 回答2: 《视觉SLAM十四-Ch3》主要介绍了视觉SLAM(同时定位与建图)技术的基本原理和实现方法。本章主要涵盖了三维几何表示和变换、相机模型和相机姿态以及特征提取与匹配等内容。 首先,本章介绍了三维几何表示和变换的概念。通过介绍欧氏空间中的点、向量和坐标变换,深入解释了相机在三维空间中的位置和朝向的表示方式。同时,引入了齐次坐标和投影矩阵的概念,为后续的相机模型和姿态估计打下了基础。 其次,本章详细解了相机模型和相机姿态的原理与应用。其中,介绍了针孔相机模型,分析了图像坐标和相机坐标之间的映射关系。通过投影矩阵的推导,给出了透视投影和仿射投影的公式,并解释了相机焦距和主点的含义。此外,还介绍了如何通过计算相机的外参矩阵来估计相机的姿态,以及如何将图像坐标转换为相机坐标。 最后,本章介绍了特征提取与匹配的技术。首先,介绍了角点和边缘点的概念,以及如何利用差分和梯度计算来检测图像中的角点和边缘点。然后,介绍了如何通过特征描述符来表示图像中的特征点,并通过特征匹配算法找到两幅图像之间的对应关系。特征提取与匹配是视觉SLAM中非常重要的步骤,对于后续的相机定位和建图至关重要。 综上所述,《视觉SLAM十四-Ch3》通过系统地介绍了视觉SLAM技术的基本概念和实现方法,包括三维几何表示和变换、相机模型和相机姿态的原理与应用,以及特征提取与匹配的技术。这些内容为读者深入理解和掌握SLAM技术提供了很好的基础。 ### 回答3: 视觉SLAM(Simultaneous Localization and Mapping)是一种通过计算机视觉技术,实现机器智能的同时实时定位和地图构建的方法。在《视觉SLAM十四》第三中,主要介绍了视觉SLAM的基本概念和关键技术。 首先,解了视觉SLAM的理论基础,包括自我运动估计和地图构建两个部分。自我运动估计是通过相邻帧之间的视觉信息,计算相机在三维空间中的运动,从而实现机器的实时定位;地图构建是通过对场景中特征点的观测和跟踪,建立起一个三维空间中的地图。这两个过程相互影响,通过不断迭代优化,实现高精度的定位和地图构建。 接着,解了基于特征的视觉SLAM算法。特征提取与描述是建立视觉SLAM系统的关键步骤,通过提取场景中的特征点,并为其生成描述子,来实现特征点的匹配和跟踪。同时,还介绍了一些常用的特征点提取和匹配算法,如FAST、SIFT等。 在SLAM框架方面,本节还介绍了基于视觉的前端和后端优化。前端主要负责实时的特征跟踪和估计相机运动,后端则是通过优化技术,对前端输出的轨迹和地图进行优化求解,从而提高系统的精度和鲁棒性。 最后,本节提到了几个视觉SLAM的应用场景,如自主导航、增强现实等。这些应用对于实时高精度的定位和地图建立都有着很高的要求,因此,视觉SLAM的技术在这些领域有着广泛的应用前景。 总的来说,《视觉SLAM十四》第三视觉SLAM的基本概念和关键技术进行了系统的介绍。理论基础、特征提取与描述、SLAM框架和应用场景等方面的内容都给出了详细的解释和案例,有助于读者更好地理解和应用视觉SLAM技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值