Accurate, Dense, and Robust Multi-View Stereopsis论文分析与代码实现（一）

最新推荐文章于 2022-08-29 18:20:34 发布

liujiboy

最新推荐文章于 2022-08-29 18:20:34 发布

阅读量4.1k

点赞数 14

分类专栏：技术研究文章标签：三维重建计算机视觉 MVS

本文链接：https://blog.csdn.net/liujiboy/article/details/52829333

版权

Accurate, Dense, and Robust Multi-View Stereopsis论文分析与代码实现（一）

本文版权属于重庆大学计算机学院刘骥，禁止转载

前言

本文依据论文Accurate, Dense, and Robust Multi-View Stereopsis进行写作，分析该论文的各种算法，给出具体的实现方法。Accurate, Dense, and Robust Multi-View Stereopsis这篇论文的第一作者Yasutaka Furukawa（中村雄辉）现在是华盛顿大学（Washington University）的助理教授（Assistant Professor），曾经在Google等IT企业任职。有兴趣的应该看看他的个人主页。总之他是一个牛人。Accurate, Dense, and Robust Multi-View Stereopsis是2007年发表在Computer Vision and Pattern Recognition期刊上的论文，按照时间推测，应该是Yasutaka Furukawa博士期间的工作。这篇论文对应他编写的PMVS2软件。PMVS2软件是少数几个在工业领域成功应用的多视图三维重建软件。

鄙人写作本文的目的主要包括：
1. 向学生介绍（主要是鄙人的研究生）10年前MVS（Multi-view Stereo）方面的重要方法，详细分析算法流程，给出代码实现，帮助他们在学习过程中少走弯路。
2. 通过讲解这篇论文，阐述一些学习和研究的方法。

重庆大学的研究生大体上分层3个层次：看不懂论文、看得懂论文但不知道如何实现、看得懂论文也知道如何实现。鄙人见得最多的是第一个层次。每年研究生招生的时候，问得比较多的一个问题是：“阁下如何规划研究生阶段的学习”。一般的回答都是这样的：“我准备提高自己的动手能力，我不喜欢做理论研究”，稍微愣头青一点的会说：“我不喜欢看论文，我喜欢做项目”（遇到这种学生心都凉半截）。每年这个时节也能在电梯中遇到很多将要毕业的研究生。大体的对话有这些：“论文才写了3000字”、“介绍一个凑字数的办法”、“查重还没有过”。鄙人可是有证据的：
这里写图片描述

总体来看，尽管研究生是要求写论文的（即便是专硕也是要写毕业论文的），但是论文似乎总是处于研究生学习的对立面。甚至有些学生会认为，如果老师让他们读论文，那是在浪费他们的青春。青春是什么？青春应该是到企业去实习，去做项目。持这种看法的二年级同学特别多。

本想论述一下研究生教育，写了一部分，鄙人就删除了，因为与鄙人的身份和地位不符。鄙人还是谈论现象吧。作为研究生导师，鄙人最喜欢的学生当然是“看得懂论文也知道如何实现”，在社会上发展得比较好的也是“看得懂论文也知道如何实现”的这类学生。我们可以很清楚的发现这样一种现象：没有学生是懂得实现但看不懂论文。或者反向推理：看不懂论文的学生，基本也不懂实现。

现在的企业招聘搞得很复杂，其实只要问一下研究生是做什么方向的，然后找一篇相关的paper让他去读，看得懂的一般都是技术靠谱的，看不懂的一般技术都有问题，至少后期的发展恐怕很有限。一流企业都很重视研究生在校期间发表的论文水平，也在于此。

Yasutaka Furukawa在校期间就是优秀的研究生，他做的软件有300多MB的源代码，他发表的论文是世界顶级的。阁下说他是在搞理论吗？阁下写的程序有300多MB的源代码？阁下做过的项目有300多MB的源代码吗？

闲话少说，切入正题吧。鄙人这篇文档需要分成好几个部分才能写完，在此期间，请下载Accurate, Dense, and Robust Multi-View Stereopsis，编译安装PMVS2（很多人直接就会卡在这里吧）。这个文档的写作会花费数周的时间，鄙人会将程序代码发到coding.net(https://git.coding.net/liujiboy/Furukawa2006.git)上面。

论文写作背景

论文Accurate, Dense, and Robust Multi-View Stereopsis的研究领域属于三维重建（3D Reconstruction）。三维重建有很多方法，其中一种是利用多张图像进行三维重建，最近称为MVS（Multi-View Stereo）。这种重建成本低、设备简单、非接触、无伤害，因此在娱乐、CAD、文物保护等领域有广泛的应用。Google地图的街景和Google地球的3D模型都应用了这种技术。介绍一个比较有趣的应用——Photo tourism，效果非常棒！过去10年，这个领域的发展相当迅速。最近几年随着无人机航拍器的发展，越来越多的人开始将这种技术用在航拍数据的重建。例如香港科技大学权龙教授的团队研发了三维地图平台。国内的“第三届全国研究生智慧城市技术与创意设计大赛”中有一个题目就是无人机航拍数据的三维重建。明德学院提供了一个在线的算法测评，可以在这里查到过去几十年比较有影响力的算法（相关领域最早追溯到上个世纪70年代）。牛津大学也提供了一

最低0.47元/天解锁文章

liujiboy

关注

14
点赞
踩
37

收藏

觉得还不错? 一键收藏
9
评论
Accurate, Dense, and Robust Multi-View Stereopsis论文分析与代码实现（一）

讲解Accurate, Dense, and Robust Multi-View Stereopsis
复制链接

扫一扫

专栏目录