[读书笔记/翻译]Multiple View Geometry in Computer Vision-1.7, 1.8, 1.9, 1.10

1.7 Euclidean reconstruction

之前我们学到的那些方法,参数并不齐全。如果镜头的完整calibration都知道了,则我们可以避免重建场景中的一些不确定性。

之前学到的都是投影重建,包含了不知道镜头或场景的calibration所重建出的所有可能,很多情况下这种方法并不足够。如果希望重建的模型能够获得物体的正确(欧式)形状,需要得到镜头的calibration。之前已经知道了,确定世界的欧式结构等价于指定无穷远平面和绝对二次曲线。假设我们已经使用calibrated cameras计算得到了投影重建,通过定义,我们知道这意味着每幅图的IAC都已知,假设第i幅图的IAC为wi。每个wi的逆投影是空间中的一个圆锥,而绝对二次曲线一定在这所有圆锥的交叉中。两个圆锥的交叉理论上是一个四阶曲线,但一直它们必定交叉于二次曲线,那么这个曲线会被划分为两个二次曲线。因此,两幅图像的绝对二次曲线重建并不唯一,我们会得到两个可能的解。而对于三个以上的图像,解是唯一的。从而得到了场景的欧式结构。

如果知道了场景的欧式结构,也就知道了绝对二次曲线的位置。从而可以将它投影到每个图像得到对应的IAC,然后calibrate镜头(校准镜头?)。这也就是上面说的,知道camera calibration等价于可以确定场景的欧式结构。

1.8 Auto-calibration

要确定绝对二次曲线的位置,我们需要知道至少一点点calibration of the cameras的知识。

假设对一个用于重建场景的图像序列,我们知道每个镜头的calibration都一样。对每幅图定义坐标系统,在每幅图中测量对应的特征的图像坐标来进行投影重建。假设在所有的图像坐标系中IAC一样,只是位置不知道,则根据以上的知识,我们可以计算出绝对二次曲线的位置。

一种方法是假设一副图像中IAC的位置,通过假设,其他图像中的IAC也具有相同的位置。然后逆投影得到几个圆锥,如果三个圆锥交叉于一个二次曲线,则这一定是绝对二次曲线的可能位置,与重建相符。

但这只是个假设,IAC一定是包含复平面点的,而逆投影也一定是个复圆锥。但IAC可以描述成实数二次方程格式,逆投影的圆锥也一定可以表现成实数四次方程。对IAC的某些值,三个逆投影圆锥就可以在一个二次曲线相交。

尽管知道三个镜头具有一样的calibration,就可以得到绝对二次曲线,从而得到镜头的calibration。但看看下面提出的这些方法,你会发现这仍然是个棘手的问题:

知道无穷远平面 auto-calibration的方法提出,首先确定无穷远的平面,然后得到世界的放射几何。第二步,找出绝对二次曲线在平面中的位置来得到空间的欧式几何。假设知道了无穷远的平面,就可以逆投影假设的IAC,得到想要的圆锥。如果IAC选择正确,则可以得到绝对二次曲线。因此对每对图像都可以得到一种情况,逆投影的圆锥在无穷远平面上一个相同的二次曲线处相交。这给出了IAC矩阵元的一个线性约束。根据线性方程组我们可以得到IAC,从而解出绝对二次曲线。如果知道了无穷远平面,这个方法就很简单。但无穷远平面本身的定义实质上很难。

Auto-calibration给定图像中的square pixels 如果镜头是部分calibrated,则可以通过投影重建来计算calibration。已知每幅图的欧式坐标系,则无穷远平面的绝对二次曲线一定在图像平面中有两个虚圆点(circular point)。穿过图像中虚圆点的逆投影射线一定与绝对二次曲线交叉,因此每个带有square pixels的图都可以确定两条射线必与绝对二次曲线相交。给出N个图,Auto-calibration的任务变成了决定一个空间的二次曲线,与2n个射线相交。也就是获取2n个射线与平面的交点,得到交点拼成的二次曲线。与8条射线相交得到的二次曲线的结果数量是有限的,因此4幅图就可以从有限的可能中确定calibration。

1.9 The reward I : 3D graphical models

image

注:以上讲的是我们学到了点的重建,我们就可以通过密集的点的集合来重建复杂的三维模型,而不是用线的重建。此节没有实质内容所以没翻译。

1.10 The reward II: video augmentation

自动重建技术现在被用来在真实电影中加入人工元素。最重要的一点是要得到镜头的正确运动。如果没有得到镜头正确的运动,不可能生成模型正确的序列,和背景融为一体。我们要的只是镜头的运动,不需要重建场景。

一旦知道了镜头正确的运动,和它的calibration,就可以使插入的物体以一种真实的方式渲染。如果帧与帧之间的camera calibration被正确定义,镜头会在序列中改变焦点长度(zoom)。甚至通过剪辑principal point都会改变。

如果要插入的模型位于现有场景的最上层, 方法还比较直观,否则就要面临遮挡问题。

第一章结束

 

 

### 回答1: 《多视角几何在计算机视觉中的应用》是一本介绍计算机视觉领域多视角几何理论和应用的重要书籍。该书对三维几何重建、结构从运动重建、摄像机标定和三维物体跟踪等多个方面进行了深入的探讨。 书中通过对多视角几何原理的解析,帮助读者了解多个视角的图片是如何联合起来构建三维空间的。同时还介绍了三维物体的降维表示,如何从二维图像中计算出相机的运动轨迹、三维点的空间坐标等重要理论。 本书还讨论了多个应用场景。例如物体识别、视觉追踪、目标跟踪和视觉测量等领域中如何应用多视角几何理论和技术。此外,该书还涵盖了大量的示例,深入浅出地讲解了多视角几何中的重要概念和算法,对于从事计算机视觉研究的科研人员、工程师等具有很高的参考价值。 总之,《多视角几何在计算机视觉中的应用》是一本应用广泛的计算机视觉专业书籍,它系统地介绍了多视角几何理论及其应用,通过大量的实例,能够让读者更好地了解计算机视觉领域中多视角几何的理论和方法,进而为实际应用提供了帮助。 ### 回答2: 《Multiple View Geometry in Computer Vision》是由Richard Hartley和Andrew Zisserman合著的一本介绍计算机视觉中多视图几何的教材,该书囊括了多视图立体重建、多视图三角化、基础矩阵和本质矩阵估计、单目SLAM等多个领域的内容。本书以深入浅出的方式介绍了多视图几何的核心理论,并指导读者将这些理论应用于实际场景中的计算机视觉问题解决方案。 本书内容主要分为三个部分,第一部分介绍了多视图几何基础理论,包括三角化、投影和相机模型、单应性和基础矩阵等;第二部分介绍了立体和运动估计,如结构光三维重建、视差估计、非刚性结构运动跟踪等;第三部分介绍了计算机视觉中的实际应用,包括单目SLAM、多视图跟踪和三维重建等。 本书涵盖了计算机视觉中多视图几何的各个方面,对于想要深入学习该领域知识的学者和研究者来说是一本非常好的参考书。在本书的指导下,读者可以理解计算机视觉中多视图几何的核心理论,并将这些理论应用于实际场景中的计算机视觉解决方案中。因此,多视图几何在计算机视觉中具有重要的研究和应用价值。 ### 回答3: 《Multiple View Geometry in Computer Vision》是一本由Richard Hartley和Andrew Zisserman编写的经典教材。该书主要讲述了计算机视觉中多视图几何的基本内容和应用。多视图几何是计算机视觉中的一个重要研究领域,其目的是通过多张图像来恢复三维世界的几何结构和对象姿态。 该书首先介绍了多视图几何中的基本概念和数学工具,如相机模型、基础矩阵、本质矩阵和三角测量等。然后,书籍详细地介绍了多视图几何的多个应用场景,包括立体视觉、结构从运动、多视角拍摄和三维重建等。 该书的特点在于其深入浅出的风格,注重数学理论和实践应用的平衡。此外,该书中还包含了丰富的示例和算法,可以帮助读者更好地理解和应用多视图几何技术。 总之,该书是计算机视觉领域中多视图几何的经典教材,不仅适合计算机视觉专业的研究者和学生,也适合其他相关领域的研究者、工程师和科学家参考。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值