使用亮度或照片一致性的概念,我们可以区分出在表面上的点和不在表面上的点。我们需要做的是让机器在三维空间中计算一个表面,使得表面的所有点都最大程度地保持照片一致性。
像素为图片元素,体素为体积元素。
我们发现可以利用凸优化方法有效地计算出最优重建。想象或描述可以重建的空间,比如你徒步旅行的风景,其中风景中的每一个点对应一个三维重建。假设我们根据该点的海拔高度对重建的误差进行编码,然后找到最佳重建就像找到该景观中的最低点。如果这里的风景像阿尔卑斯山一样,那么你必须真正四处游荡,直到确定找到最低点。但神奇地是,如果景观是凸面的,你可以轻松找到最低点。只需沿着山坡走下去,直到走不下去为止。
同样的是,机器可以通过最小化凸的损失函数来有效地计算最优重建(可证明最优)。通过这种方式,你可以重建整个行为。
在1913年,奥地利数学家欧文·库珀证明了如果你拍摄两张照片并考虑五个对应点,比如这张照片中的教堂塔楼,以及其它教学塔楼等等,那么就可以重构出相机的相对运动以及这些点的三维位置。
而这种先提取点,计算点之间的对应关系,进而解决SLAM问题的策略并不会得到最好的重建结果。这是因为相机并不观察点,而是观察颜色或亮度值。一旦你提取了一些点,你会在第一步漏掉有价值的亮度信息,在第二步计算对应关系时,就会在分配对应点时出现误差,并会影响到物体重建中,降低性能。
2014年,我们找到了解决这个问题的方法。我们的方法可以直接从相机的亮度值实时解决大规模的SLAM问题。我们发现相机的运动和三维结构能够使得图像的颜色一致,如果我们将这些亮度投射到世界中,并投射到其它相机中,它们是一致的。这带来了前所未有的性能和精度。这种大规模直接点SLAM算法称为LSD-SLAM,已经成为迄今为止最流行的SLAM方法之一。
因此,我们创建了一家公司,目的是提高算法及其性能。融合其它传感器的信息,比如相机、惯导、轮速计和GPS。