[读书笔记/翻译]Multiple View Geometry in Computer Vision-1.4,1.5,1.6

1.4 Three-view geometry

对于两个视点,基本的代数项是基础矩阵,而对于三视点,规则是trifocal tensor(不晓得专业翻译是什么)。它是一个3*3*3的数组,代表对应的点或线在三视点下的坐标。正如同基础矩阵是由两个镜头矩阵定义的,trifocal tensor是由3个镜头矩阵定义,之间的对应关系也与2视点相同,同样取决于投影转换。

trifocal tensor的格式是image,有两个上标一个下标。

考虑图像中的一个点x,和另外两幅图像中的线l'l'',表示空间中的点X映射到图像1中的x,以及在另外两幅图中线l'l''上的x'x''。于是得到

image

我们可以任意地选择经过点x'x''的线,从而生成足够的线性方程组。同样的,7个点足够线性的求解,而最小可以由6个点用非线性方法求解。

trifocal tensor的27个项遵循一种很复杂的内部约束,而基础矩阵的内部约束则简单的多:F=0。

使用3视点重建的优点如下:

  1. 可以通过一系列点和线的对应关系来进行投影重建。2视点只能使用点的对应关系。
  2. 使用3视点会大大加强重建的稳定性,避免了2视点可能带来的不稳定格局。
1.5 Four view geometry and n-view reconstruction

4视点重建一般不采用quadrifocal tensor的方法,因为内部约束过于复杂。多视点的重建考虑过许多方法,比如划分开来用2视点或3视点重建。如果我们可以采用仿射镜头,重建的任务会简单许多。只要场景前后的深度远小于镜头到到场景的距离,镜头模型就是透视投影的近似。于是可以采用一个经典算法factorization algorithm来计算场景结构,而指定的镜头模型使用Singular Value Decomposition。这个算法要求所有点在所有视图中可见。

一般重建问题的主要方法是bundle adjustment,这是一种迭代方法,使非线性模型与测量数据相对应。优点是最具一般性,用于广泛的重建和优化问题中。但由于是迭代方法,对于任意的初始点,不保证收敛得到最优解,需要一个初始化。

注:本节讲了一些方法,我并没有全部翻译,只是挑了几个主要部分。

1.6 Transfer

投影几何的另一个应用是转换:给定一个视点的点,得出它在其他视点的位置。方法就是:

  1. 根据其他点的对应关系image计算3个视点下的镜头矩阵P,P'P''
  2. 根据P,P',从给出的点xx'重建出3D点X
  3. 再投影得到指定视图的点x''=P''X

还有一种方法是直接根据3视点丈量来转换,无需显式地重建。两种方法各有优劣。

假设镜头沿中心旋转,或者所有的场景点位于一个平面。则多视点关系近似看做图像间的共面投影转换。在这种情况下,可以从一个图像中的点直接转换到其他图像。

本文原创, 转载请注明出处

http://www.cnblogs.com/luluathena/

转载于:https://www.cnblogs.com/luluathena/archive/2010/10/05/1842937.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值