论文:添加链接描述
摘要
自监督单目深度估计提供了一种可以从单个图片中获取3D场景信息的方法,该信息可以在任意图像序列上进行训练,而无需地面深度信息。在这项工作中,我们提出了一种自监督的语义指导深度估计方法(SGDepth),用于处理运动的动态类(DC)对象,例如运动的汽车和行人,这些对象违反了在训练此类模型时通常做出的静态世界假设。具体来说,我们提出了:
(i)深度估计和语义分割的跨域训练
(ii)语义分割产生mask,使运动的DC物体不参与光度损失的计算
(iii)一种能检测不运动的DC物体的检测方法
贡献
1、自监督单目深度估计
(1)最小重投影损失
1)先将图像投影至3D点云
2)再乘以姿态进行坐标转换
3)然后再重投影至图像
重投影的图像为
最小重投影损失为