深入研究自监督单目深度估计：Monodepth2

最新推荐文章于 2024-07-17 14:27:17 发布

3Ｄ视觉工坊

最新推荐文章于 2024-07-17 14:27:17 发布

阅读量2.6k

点赞数 1

分类专栏： 3D视觉从入门到精通文章标签：算法计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yong_Qi2015/article/details/110944366

版权

3D视觉从入门到精通专栏收录该内容

598 篇文章 781 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文深入剖析了Monodepth2模型，该模型通过结合逆深度估计和相机位姿估计，解决了单目深度估计中的遮挡和物体运动难题。文章详细介绍了模型的逆深度估计模块、相机位姿估计模块以及训练中采用的损失函数改进，展示了其在单目深度估计中的优越性能。

摘要由CSDN通过智能技术生成

单目深度估计模型Monodepth2对应的论文为Digging Into Self-Supervised Monocular Depth Estimation，由伦敦大学学院提出，这篇论文的研究目标是从单目RGB图像中恢复出对应的深度，由图1所示：该网络可以从单目图像中恢复对应的深度，图中不同颜色代表不同的深度。

论文地址：在公众号「3D视觉工坊」，后台回复「Monodepth2」，即可直接下载。

图1 Monodepth深度估计图

目前单目深度估计的难点，同时也是本论文着重解决的方向：

1、图像序列中存在遮挡。

2、当场景中发生物体运动的情况，如场景中运动的车辆，此时图像序列不仅存在因相机位姿而产生的图像改变，还存在因运动物体而产生的图像亮度的改变

从理论上说：在未给定第二帧图像的情况下估计图像对应的绝对或相对深度值是一个病态问题，因为无法通过构建三角化求解对应深度。然而，从直觉上说：人类通过在现实场景中生活、学习，获得了单眼估计深度的能力。因此，类比人类的学习能力，利用深度学习技术，从单目图像中获取对应的深度是可行的。该篇论文联合相机位姿估计与单目深度估计两项任务，使单目深度估计成为了可能。具体来说便是：首先利用单目深度估计网络进行逆深度估计，需要注意的是&#

了解本专栏

超级会员免费看

3Ｄ视觉工坊

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
2
评论
深入研究自监督单目深度估计：Monodepth2

点击上方“3D视觉工坊”，选择“星标”干货第一时间送达单目深度估计模型Monodepth2对应的论文为Digging Into Self-Supervised Monocular Dep...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

3Ｄ视觉工坊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。