1. 研究背景与意义
从RGB图中预测深度。利用二维图像来进行场景的深度估计是计算机视觉领域的经典问题之一,也是实现三维重建、场景感知的重要环节。深度信息有助于更好地理解3D场景,也有助于完成许多计算机视觉任务。如机器人定位、自动驾驶、三维重建、3D目标检测等;
来源:深度预测任务可以由专用硬件完成,如微软的测距仪和 Kinect 摄像头,但价格昂贵、场景有限,大多数图像都是由普通相机拍摄的,只含场景的颜色信息。为了重建深度信息,研究人员尝试直接从 RGB 图像中预测深度,这种方法与通过专业硬件设备获得深度信息相比,更具有普遍性。