CV10-三维重建1

最新推荐文章于 2024-01-31 11:14:30 发布

长命百岁️

最新推荐文章于 2024-01-31 11:14:30 发布

阅读量1.5k

点赞数 3

分类专栏：计算机视觉文章标签：计算机视觉深度学习 opencv

本文链接：https://blog.csdn.net/qq_52852138/article/details/122491928

版权

计算机视觉专栏收录该内容

11 篇文章 5 订阅

订阅专栏

三维感知

单张图像

通过图像上点的位置，来估计该点在三维空间中的位置。

单目相机，理论上三维重建是不准确的。通过一个二维点恢复三维坐标是一对多的
在这里插入图片描述

双目/多目

物体的深度值越大，在两幅图之间的视觉差越小。我们可以基于这个来判断物体在三维空间中的深度
在这里插入图片描述
基于双目计算深度（RGB->RGBD）

三角化

通过两张图片对应点与相机所在的直线，来确定三维空间中物体所在的位置
在这里插入图片描述
那么进行三角化时，需要知道哪些信息呢？

相机参数
- 外参：相机的位置和朝向（对应着平移和旋转）
  - 知道两个相机坐标系之间的相对关系就能求解
  - 我们下面所做的所有工作都是为了求出两个坐标系之间的相对关系 $[R, t]$
- 内参：相机的焦距等参数
像素对应关系（就像上图所示，需要通过对应像素来确定位置）

针孔相机模型

$(x, y)$ 为成像面上成像点的坐标， $(X, Y)$ 为空间中的三维点的坐标

在这里插入图片描述
转换成矩阵形式表达

相机坐标系

在这里插入图片描述

主点偏移

与针孔相机模型的区别就是，增加了 $x$ 方向上的平移参数 $p_x$ 和 $y$ 方向上的平移参数 $p_y$
在这里插入图片描述

像素长宽比

CCD（将图像转换为电信号的半导体元件，用于成像）单元长宽比不为一，因此需要乘以额外的比例系数
在这里插入图片描述
我们可以将上述式子简化，就是将前两个矩阵合并，将 $f$ 区分为 $f_x$ 和 $f_y$

像素不是矩形

这就代表着CCD行与列不垂直，其实就是切变。因此，我们对 $x$ 坐标加上与 $y$ 相关的额外参数。这个并不常用
在这里插入图片描述

相机内参

焦距f ，CCD长宽比，CCD行与列不垂直，都是相机内部影响，因此上面式子的第一个矩阵表示的其实是相机内参

$X_{cam}$ 代表相机坐标系中的坐标
在这里插入图片描述

上面论述的情况都基于这样一个假设：三维空间中的点处于相机坐标系中，但是如果这个点不在相机坐标系中呢？
在这里插入图片描述
我们利用相机的位置和旋转矩阵来将世界坐标系中的一点，转换到相机坐标系中。其中 $X - C$ 是世界坐标中的一点相对于相机关心的偏移向量。 $R$ 是相机的旋转矩阵， $C$ 代表着相机的平移

我们将这个式子也表示成矩阵的形式，并且与相机内参的矩阵进行合并
在这里插入图片描述
我们考虑了各种情况后，得到一般性的相机投影矩阵 $P = K [R ∣ t], t = - R C$ 。其中 $K$ 是相机内参矩阵， $[R ∣ t]$ 是相机外参矩阵

相机外参

包括 $R$ 和 $t$ ，其中 $R$ 是旋转矩阵， $t = - R C$ ， $C$ 是相机在世界坐标系中的坐标
在这里插入图片描述
总结：三维重建需要相机内参(内参矩阵 $K$ )，相机外参 $R, t$ ，立体匹配（像素对应关系）

运动推断结构

Structure from Motion , SFM：从相机运动太获取场景的三维点云
在这里插入图片描述

如果运动已知

在这里插入图片描述
但是相机运动和三维点云都未知

极线

概念

在这里插入图片描述

极线约束

由极线约束，引出本质矩阵
在这里插入图片描述
左边视图上的点在右边视图上的对应点一定在极线上。右边视图上的点在左边视图上的对应点也在极线上。

上面得到过 $x = K[1|0]X_{cam}$ ，其实就是 $x = KX_{cam}$ ，因此，可以可以通过 x 得到点的三维坐标
$R, t$ 是将将左边坐标系中的点转到右边坐标系中所需要的旋转和平移参数。 $R, t$ 是右边坐标系相对于左边坐标系的位置和姿态
$p_0$ 和 $p_1$ 分别是 $p$ 在两个相机坐标系中的坐标。这里的 $p_0$ 和 $p_1$ 是不知道的，因为深度不知道。我们的目的就是要求出 $p_0$ 和 $p_1$ 。但是要先求出 $[R, t]$

知道 $[R, t]$ 之后有好几种方法可以求出 $p_0,p_1$ 。理论上 $c_0x_0,c_1x_1$ 会交于同一点，但是由于图像分辨率以及噪声的存在，实际的情况更可能是上图所描述的那样： $c_0x_0$ 和 $c_1p_1$ 在空间中没有交点，这时我们需要找到一个 $c_0x_0$ 与 $c_1p_1$ 之间的公垂线，然后取其上的中点作为我们重建出的三维点。
在这里插入图片描述
通过一系列推导我们可以得到一个简洁的表达式，也就是推导的最后一行得到的结果。我们称 $E$ 为本质矩阵

由 $E$ 的表达式可知，本质矩阵 $E$ 由 $R, t$ 决定。那我们已知 $E$ 的话，能否求出 $R, t$ 呢？

从 $E$ 到 $R, t$

结论：任意本质矩阵都可以通过SVD分解为如下形式，因为本质矩阵的秩为2，且两个非零奇异值相等（不懂）
在这里插入图片描述
相应的 $[R, t]$ 存在四种可能

这四种可能的解分别对应四种物理意义
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bG2bAPGn-1642136476203)(C:\Users\nishiyu\AppData\Roaming\Typora\typora-user-images\image-20211226132021255.png)]$
可见，只有一中解满足实际的物理意义，因此已知本质矩阵 $E$ 可以求出 $R, t$ 。
在这里插入图片描述