单目估计与双目估计的思考
今天在上人工智能课程的时候,轮到我介绍我的研究方向–立体匹配与三维重建,在讲完课间后,老师问了我一个问题,单目也可以估计深度,为什么去研究双目估计深度,是单目有什么限制吗,毕竟只使用一个摄像头的成本更低。
老师的这个问题,我在课上并没有给出答案,我想了想,在我刚接触这个研究方向的时候,确实也想过这个问题,但是当时并没有花时间去查资料、对比他们的区别,这也告诫我以后要有什么想到的不懂的,要积极去查资料,而不是放任他不管。
近来,寻找了一些相关资料,来阐述一下我的理解。
首先,单目深度估计是利用物体成像大小来预测距离的,物体大的距离近,小的距离远。相机成像实际上就是一个中心投影的过程,要想计算出图像中物体的距离,实际上就是平衡物体的大小和距离的远近,因为物体有成像近大远小的特点,因此一个近距离的小物体,和一个远距离的大物体可能会在图像上呈现相同的大小,因此依靠图像大小来衡量物体的距离是没有理论支撑的,他需要大量的数据来训练网络,来拟合真值,而且单目深度估计目前只停留在实验室中,难以应用落地。这就是单目深度估计目前存在的一些问题。
关于单目的一些知识,我也不是很了解,如果有什么错误,请大家积极指正。