[读书笔记/翻译]Multiple View Geometry in Computer Vision-1.4，1.5，1.6

最新推荐文章于 2020-04-21 23:41:10 发布

weixin_30390075

最新推荐文章于 2020-04-21 23:41:10 发布

阅读量207

点赞数

原文链接：http://www.cnblogs.com/luluathena/archive/2010/10/05/1842937.html

版权

1.4 Three-view geometry

对于两个视点，基本的代数项是基础矩阵，而对于三视点，规则是trifocal tensor（不晓得专业翻译是什么）。它是一个3*3*3的数组，代表对应的点或线在三视点下的坐标。正如同基础矩阵是由两个镜头矩阵定义的，trifocal tensor是由3个镜头矩阵定义，之间的对应关系也与2视点相同，同样取决于投影转换。

trifocal tensor的格式是，有两个上标一个下标。

考虑图像中的一个点x，和另外两幅图像中的线l'和l''，表示空间中的点X映射到图像1中的x，以及在另外两幅图中线l'和l''上的x'和x''。于是得到

我们可以任意地选择经过点x'和x''的线，从而生成足够的线性方程组。同样的，7个点足够线性的求解，而最小可以由6个点用非线性方法求解。

trifocal tensor的27个项遵循一种很复杂的内部约束，而基础矩阵的内部约束则简单的多：F=0。

使用3视点重建的优点如下：

可以通过一系列点和线的对应关系来进行投影重建。2视点只能使用点的对应关系。
使用3视点会大大加强重建的稳定性，避免了2视点可能带来的不稳定格局。

1.5 Four view geometry and n-view reconstruction

4视点重建一般不采用quadrifocal tensor的方法，因为内部约束过于复杂。多视点的重建考虑过许多方法，比如划分开来用2视点或3视点重建。如果我们可以采用仿射镜头，重建的任务会简单许多。只要场景前后的深度远小于镜头到到场景的距离，镜头模型就是透视投影的近似。于是可以采用一个经典算法factorization algorithm来计算场景结构，而指定的镜头模型使用Singular Value Decomposition。这个算法要求所有点在所有视图中可见。

一般重建问题的主要方法是bundle adjustment，这是一种迭代方法，使非线性模型与测量数据相对应。优点是最具一般性，用于广泛的重建和优化问题中。但由于是迭代方法，对于任意的初始点，不保证收敛得到最优解，需要一个初始化。

注：本节讲了一些方法，我并没有全部翻译，只是挑了几个主要部分。

1.6 Transfer

投影几何的另一个应用是转换：给定一个视点的点，得出它在其他视点的位置。方法就是：

根据其他点的对应关系计算3个视点下的镜头矩阵P，P'和P''。
根据P，P'，从给出的点x和x'重建出3D点X
再投影得到指定视图的点x''=P''X。

还有一种方法是直接根据3视点丈量来转换，无需显式地重建。两种方法各有优劣。

假设镜头沿中心旋转，或者所有的场景点位于一个平面。则多视点关系近似看做图像间的共面投影转换。在这种情况下，可以从一个图像中的点直接转换到其他图像。

本文原创，转载请注明出处

http://www.cnblogs.com/luluathena/

转载于:https://www.cnblogs.com/luluathena/archive/2010/10/05/1842937.html

weixin_30390075

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[读书笔记/翻译]Multiple View Geometry in Computer Vision-1.4，1.5，1.6

1.4 Three-view geometry对于两个视点，基本的代数项是基础矩阵，而对于三视点，规则是trifocal tensor（不晓得专业翻译是什么）。它是一个3*3*3的数组，代表对应的点或线在三视点下的坐标。正如同基础矩阵是由两个镜头矩阵定义的，trifocal tensor是由3个镜头矩阵定义，之间的对应关系也与2视点相同，同样取决于投影转换。trifocal te...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。