论文链接:http://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Learning_Depth_From_CVPR_2018_paper.pdf
(代码已开源鸭)
摘要
使用非监督的策略从单张图片中学习深度图非常的具有吸引力,因为它可以利用大量且种类丰富的单目视屏数据库,无需ground truth 和双目数据。在之前的工作中,姿态和深度的神经网络共同输出减小photometric error。 根据直接视觉测距法(direct visual odometry, DVO)的发展, 作者认为深度预测神经网路(depth CNN predictor)可以无需姿态预测器(depth CNN predicotr) 进行训练。作者融合了可以求导的DVO策略,以及深度归一化的策略以提高单目视屏训练。
introduction
zhou的文章提出通过减小photometric consistency 训练分离的深度和姿态对预测神经网络。尽管获得了令人印象深刻的结果,但是效果与进行过矫正的双目照片对相比仍是差强人意。 这些经过矫正的双目方法[1][2]在只提供离散深度值标定的数据集上展现