【论文阅读】Modeling the world from internet photo collections

1、摘要

互联网上有大量的图片,构成了最大和最多样的照片集合。计算机视觉研究者们该如何利用这些图片进行研究呢?本文从3维场景建模和可视化的角度探索这个问题。我们展示了一个structure-from-motion and image-based rendering 的算法,这个算法可以对由关键词搜索得到的图片进行操作。我们叫这个方法为 Photo Tourism,此方法已经促进了许多世界著名遗址景点的重构工作。这篇文章展示的算法和结果是对拥有良好照片(来自互联网)的世界遗址、城市、风景等进行三维场景重建的第一步。最后,我们还讨论了研究团队遇到的困难和关键开放性问题。

2、介绍

网络图像由于其无序、未校准、变化多、亮度不受控制、分辨率和质量等问题,而 很难被传统计算机视觉所应用。将这些图片应用在计算机视觉领域的一个主要挑战是:两张图片对应3D坐标的匹配问题。

本文的行文思路:首先回顾最新技术,然后介绍解决此问题的一些步骤,以及我们称之为Photo Tourism的可视化前端。然后,我们为本领域提出了一组开放的研究问题,包括为超大图像数据集创建更有效的对应和重建技术。本文的研究是在2006年文章的基础上发展而来的,发展了新的算法,更多详细内容详见:http://phototour.cs.washington.edu.

3、先前技术(历史介绍)

  • 特征匹配
  • SFM
  • 基于图像的重建
  • 基于图像的渲染
  • 图像浏览、图像标签的标注和传递

4、重建过程

4.1 关键点的检测和匹配

  1. 特征点检测:用SIFT提取每张图片的特征点,SIFT对每张图中每个特征点产生一个128维特征向量。SIFT提取特征的原理见SIFT原理
    在这里插入图片描述
    图中每个 f e a t u r e feature feature都是128维的向量

  2. 特征点的匹配:目的是需要让图片间,对应的特征点之间赋予权值。举例:如图,对imge1、imge2、imge3、imge4中,玩偶眼睛部位对应特征点互相建立权值,而不与其他部位相匹配。
    在这里插入图片描述

  3. 为了达到这个效果,需衡量特征点之间距离,由上一步sift特征提取过程,每个特征点由一个128维的向量描述,所以特征点之间的距离问题就是高维向量间的距离问题
    kd-tree可以将高维向量按二叉树分类,将不同大小的特征点分类至kd-tree上不同的叶子节点
    在这里插入图片描述

  4. 衡量匹配点间的距离: 将图片 i m a g e i image_i imagei中每个特征点 f e a t u r e i , m feature_{i,m} featurei,m,用ANN(近似最近邻搜索算法)搜索 i m a g e j image_j imagej的kd树中与 f e a t u r e i , m feature_{i,m} featurei,m最近的特征点,在不多于200次搜索中确定出2个最近邻点;
    如果两个最近邻 f e a t u r e j , p feature_{j,p} featurej,p f e a t u r e j , q feature_{j,q} featurej,q,与 f e a t u r e i , m feature_{i,m} featurei,m距离分别为d1,d2。且 d   1   d   2   \frac{d~1~}{d~2~} d 2 d 1 <0.6,则接受 f e a t u r e j , p feature_{j,p} featurej,p 认为 f e a t u r e i , m feature_{i,m} featurei,m与其匹配

  5. 为了保证图像两两之间的特征点匹配是1对1的,将 i m a g e i image_i imagei中所有特征点都匹配完最近邻后,只能保证两图特征点之间是1对1 或 n对1,若是n对1,则将相关的n对匹配删除

  6. 由上面步骤,可以得出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值