08 计算相机运动

最新推荐文章于 2024-08-16 09:06:51 发布

算法导航

最新推荐文章于 2024-08-16 09:06:51 发布

阅读量2.4k

点赞数 39

文章标签：算法 SLAM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44175983/article/details/134959232

版权

文章目录

- 08 计算相机运动

08 计算相机运动

8.1 提取特征点

读取图像 --> 提取角点 --> 计算各角点的描述子 --> 匹配描述子（计算汉明距离）–> 根据汉明距离去除误匹配点对 --> 绘制结果

根据匹配好的像素点对估计相机的运动。

（1）如果只有两个单目图像，得到 2D-2D 间的关系，用对极几何解决；

（2）如果匹配的是 帧（2D）和地图（3D） ，则得到 3D-2D 的关系，通过 PnP 求解；

（3）如果匹配的是 RGB-D 图像，则得到 3D-3D 间的关系，用 ICP 求解。

8.2 对极几何

8.2.1 几个矩阵

具体推导见笔记《视觉里程计 1》。

$\boldsymbol{x_2^T}\boldsymbol{t}^{\wedge}\boldsymbol{R x_1}=0$

这就是对极约束，其中 $\boldsymbol{x}_1$ 为归一化坐标。

带入像素坐标，得

$\boldsymbol{p_2^TK^{-T}}\boldsymbol{t}^{\wedge}\boldsymbol{RK^{-1}p_1}=0 \tag{6-9}$

至此，容易看出，我们只需要知道两张图的像素坐标以及相机内参即可求出相机运动 $\boldsymbol{R}$ 、 $\boldsymbol{t}$ 。

将中间部分分别记为：基础矩阵 $\boldsymbol{F}$ 和本质矩阵 $\boldsymbol{E}$ ，即

$\boldsymbol{E}=\boldsymbol{t}^{\wedge}\boldsymbol{R}$
$\boldsymbol{F}=\boldsymbol{K^{-T}}\boldsymbol{E}\boldsymbol{K^{-1}}$
$\boldsymbol{x_2^T}\boldsymbol{E}\boldsymbol{x_1}=\boldsymbol{p_2^T}\boldsymbol{F}\boldsymbol{p_1}=0 \tag{6-10}$

根据以上推导，相机位姿估计问题简化为以下两步：

根据匹配点的像素坐标和相机内参求出本质矩阵 $\boldsymbol{E}$ ；
由本质矩阵求出 $\boldsymbol{R}$ 和 $\boldsymbol{t}$ 。

同理，单应矩阵可用类似方法求解。

本质矩阵自由度为 5，理论上 5 对点即可求解，实际采用八点法；而单应矩阵 4 对点即可求解。

8.2.2 相机坐标系与归一化坐标系

相机内参：

$\left[\begin{array}{ccc} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{array}\right]$

其中， $c_x，c_y$ 是相机光心，也就是相机的光学中心在图像平面上的 $x ， y$ 坐标； $f_x，f_y$ 是焦距。

像素坐标 $(u, v)$ 到归一化坐标 $(x, y)$ 的转换：

$x = (u - c_x) / f_x \\ y = (v - c_y) / f_y$

归一化坐标 $(x, y)$ 到像素坐标 $(u, v)$ 的转换：

$u = (x * f_x) + c_x \\ v = (y * f_y) + c_y$

8.2.3 三角测量

即根据计算得到的 $\boldsymbol{R}，\boldsymbol{t}$ 恢复出尺度 $s$ ，进而求出三维空间坐标。

$s_2\boldsymbol{x_2}^{\wedge}\boldsymbol{x_2}=0=s_1\boldsymbol{x_2}^{\wedge}\boldsymbol{R}\boldsymbol{x_1}+\boldsymbol{x_2}^{\wedge}\boldsymbol{t}$

8.3 PnP: 3D-2D

简单来说，PnP 位姿估计就是通过几个已知坐标(世界坐标)的特征点，结合他们在相机照片中的成像(像素坐标)，求解出相机所在的世界坐标以及旋转角度。

主要有三种求解方法：

直接线性变换（DLT）：至少需要 6 对点
P3P：3 对点即可，当给定的配对点多于 3 对时，难以利用更多的信息。
非线性优化即 BA

针对 BA 求解，以 g2o 为例，以相机位姿和 3D 点坐标为顶点，以对应的像素坐标为观测值。

8.4 ICP：3D-3D

针对一组匹配好（已知对应关系）的 3D 点，可用 ICP 算法求解。与激光 SLAM 中的 ICP 不同，激光点云数据特征不够丰富，无法知道两个点集之间的匹配关系，只能认为距离最近的两个点为同一个，再逐步迭代。

SVD 方法
非线性优化

8.5 总结

一、基础矩阵、单应矩阵用像素坐标求解；本质矩阵、三角测量用归一化坐标求解。

单应矩阵直接描述了图像坐标之间的变换：

$\boldsymbol{p}_2 = \boldsymbol{H}\boldsymbol{p}_1$

二、在 ORB-SLAM 中这几种方法的顺序为：

提取两张图像的匹配点，利用对极几何计算 $\boldsymbol{H}$ 矩阵和 $\boldsymbol{F}$ 矩阵，从而恢复 $\boldsymbol{R}$ 、 $\boldsymbol{t}$ ；
用三角测量计算各关键点对应的 3D 坐标；
跟踪丢失后，机器人就需要回到原来经过的位置找匹配帧，这个匹配帧的关键点对应的 3D 坐标是已知的，之前已经求出，利用这些 3D 点和机器人当前图像关键点像素坐标，就构成了 PnP 问题，从而可计算出当前的 $\boldsymbol{R}$ 、 $\boldsymbol{t}$ 。

关注

39
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

算法导航 CSDN认证博客专家 CSDN认证企业博客

码龄6年

90: 原创

52万+: 周排名

6万+: 总排名

5万+: 访问

: 等级

1414: 积分

495: 粉丝

510: 获赞

13: 评论

636: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++提高编程
简单简单小白: 大佬非常清晰的分析思路给我带来了很多收获，希望大佬持续创造，我们共同学习
C++ primer plus--输入、输出和文件
白话机器学习: 文章写得专业、深入、详细，收藏啦
数据结构与算法--数组
CSDN-Ada助手: 恭喜作者完成了第20篇博客，题为“数据结构与算法--数组”。你在数据结构与算法领域的持续创作令人佩服。通过这篇博客，你深入浅出地介绍了数组，让读者对其有了更清晰的理解。接下来，我很期待你能继续分享关于其他数据结构和算法的知识，比如链表、栈、队列等等。希望你能够保持谦虚的态度，不断学习和提升自己的写作能力，让更多读者受益。加油！
数据结构与算法--栈和队列
CSDN-Ada助手: 恭喜您写下了第19篇博客！标题“数据结构与算法--栈和队列”引起了我的兴趣。您在数据结构与算法方面的探索真是令人钦佩。不仅仅是栈和队列，这两个基础的数据结构在算法中扮演着重要的角色。接下来，我期待您能继续分享更多关于数据结构和算法的内容，比如链表、树或者图等等。这些内容会进一步帮助我们理解和应用这些重要的概念，真心期待你的下一篇博客！
数据结构与算法--线性表
CSDN-Ada助手: 恭喜您写了第18篇博客！标题看起来非常有吸引力，我很期待能够阅读您关于数据结构与算法中线性表的深入探讨。您的博客一直以来都给我很多启发，非常感谢您的不断分享和努力。在下一步的创作中，我建议您可以从线性表的基本概念出发，探讨不同种类的线性表及其应用场景，比如链表、数组等。同时，您也可以分享一些常见的线性表操作和算法，以及它们的时间复杂度分析。这样的内容对于学习和理解数据结构与算法非常有帮助。再次恭喜您，并期待您更多优质的博客！谢谢您的付出！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。