安妮 编译整理
量子位 出品 | 公众号 QbitAI
近日,斯坦福大学的研究人员公布了一个数据集,其中包含带有相机姿态的街景数据、8个城市的3D模型和拓展的元数据。这个数据集数据量庞大,街景数据集就包含2500万张图像和1.18亿个匹配的图像对。
数据集可用于学习6DOF相机姿态估计/视觉运动、图像匹配及各种三维估计。比如下面的这个例子:
为了得到这个数据集,斯坦福的研究人员开发了一个系统,整合来自谷歌街景图像和地理元数据的城市间地理信息系统,这其中并不需要人工标注。