一、简介
从2D图像估计深度是场景重建和理解任务的关键步骤,例如3D目标检测和分割。基于单目图像获得深度信息被定义为MDE问题(Monocular Depth Estimation)。
二、参考文献与资料
参考论文:
1、Deep Ordinal Regression Network for Monocular Depth Estimation(CVPR, 2018)
2、MonoGRNet: A Geometric Reasoning Network for Monocular 3D Object Localization(AAAI,2019 oral)
参考代码:
1、https://github.com/hufu6371/DORN
2、https://github.com/Zengyi-Qin/MonoGRNet
三、概览
深度估计问题在计算机视觉领域属于3-D重建的一部分,即Shape from X。这个X包括stereo, multiple view stereo, silhouette, motion (SfM, SLAM), focusing, hazing, shading, occlusion, texture, vanishing points, ...前面5个都是多图像的输入,从空间几何,时域变换和焦距变化的关系推导深度距离。剩下的都是单目的输入。
深度估计可以用于3D建模、场景理解、深度感知(depth-aware)的图像合成等领域。
基于深度学习的单目估计依据是像素值关系反映深度关系,方法是拟合一个函数把图像映射成深度图:。从得出的深度图轮廓和不断提高的实验结果可以看出,的确可以用一个这样的函数从像素值中恢复出相对深度值。
如果把图像模糊度建模,根据图像边缘模糊的响应模型,那么