论文:《A Space-Sweep Approach t o True Multi-Image Matching》
起因:看DSGN看不懂,什么cost volume搞不明白,然后一路摸到了这里
结果:没看太明白,论文全是语言描述,不咋用公式,英语不好,太多内容拎不清,写的很差,当笔记了。
摘要
考虑了跨多个视图确定特征对应性的问题。真正的多图像技术必须推广到任意数量的图像,在图像数量上具有线性算法复杂性,并以相等的方式使用所有图像。提出了一种新的多图像匹配的空间扫描方法,该方法可以同时确定场景中特征点的二维特征对应关系和三维位置。
引言
多图像立体重建就是利用三角测量原理,但是最难的是如何找到图像上匹配的像素点来对应现实世界中的点,从而获得特征和世界坐标。所以本文工作重点就是如何实现这一立体匹配,并可以实现任意视图数量,所有的图片都采用相同的处理方式。原文是这样说的“这篇论文的目的是探索如何充分和有效利用多幅图像与场景之间的几何关系。”
plane sweep在论文的section 3
section 2-True Multi-Image Matching
Definition: A true multi-image matching technique
satisfies the following conditions:
- the method generalizes to any number of images greater than 2,
- the algorithmic complexity is O (n) in the number of images, and
- all images are treated equally (i.e. no image is given preferential treatment)
条件3并不意味着来自所有图像的信息必须被同等加权,有些可能来自更好的观看位置、更高的分辨率或更大的焦点。不设置参考图像,源图像利用他们的对极约束。因为如果参考图像存在问题,被遮挡或怎样,那么即使其他视角完好匹配,该信息也会被剔除,导致重建结果缺少重要的3D特征。
section 3-An Efficient Space-Sweep Approach
该方法的实现是将一个空间体积分割成体素,将每个图像点反向投影为穿过这个体积的光线,并记录穿过每个体素的光线数。这种实现的主要缺点是存储空间的密集使用。
3.1 The Space-Sweep Method
多个平面沿着一条选定的直线(z轴)密集排列,占据多个相机视角的相交空间,然后在每个平面上划分网格(文中叫cell)。
所谓扫描就是沿着Z轴由远到近的扫描路径上的所有平面,得到原图像到每个平面的映射。通过将每个图像的点特征反投影到扫描平面上,利用这些反射的射线,就对该cell进行增强。至于增强的规则在3.3
3.2 Efficient Backprojection
This section shows that it is more efficient to compute feature locations in the plane Z = z i by mo difying their locations in some other plane Z = z 0 to take into account a change in Z value, than it is to apply the homography H i to the original image plane features.
空间中两个平面的坐标转换叫做单应性变换,利用相机的内外参数可以构造单应性矩阵将原图像映射到扫描的平面上。然后文中为了高效计算,觉得扫描的平面都是平行的,可以通过将扫描映射后的平面利用他们之间简单的平移构成的单应矩阵进行转换,这样不用通过原图变换了,减少计算。(英文不好,给我干迷糊了,欢迎交流)原文就是下面这一段。
3.3 A statistical Model of clutter
看不懂, 逃跑了~
推荐看这俩: