最强无监督单目深度估计Baseline--MonoViT--简介与代码复现

鸡块米线LVC

已于 2023-05-06 16:22:42 修改

阅读量3.9k

点赞数 12

分类专栏：单目深度估计文章标签：算法机器学习人工智能

于 2023-05-06 16:21:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxcqlf/article/details/126219593

版权

1. 无监督单目深度估计

单目深度估计是指，借助于深度神经网络，从单张输入视图中推理场景的稠密深度信息；该技术可以广泛用于自动驾驶、虚拟现实、增强现实等依赖于三维场景感知理解的领域，同时也可以为其他视觉任务提供多模态深度信息，辅助其他任务感知的精确性。

由于不需要标签信息而仅依据单目视频序列 or 双目立体图像对即可训练的这一巨大优势，无监督单目深度估计框架收到了越来越多的关注，并且当前的性能已经能比肩早期有监督训练方法。

随着monodepth2框架在网络预训练、损失函数设计等方面的创新，无监督训练得到的单目深度估计模型在对场景中几何细节方面的深度感知方面表现出了令人满意的性能和精度。

本文以及自监督单目深度估计的榜单，MDEB，对当前基于单目图像序列的自监督单目深度估计的SOTA/最优方案，MonoViT，进行介绍，并对其开源代码进行复现，开源代码地址：

最低0.47元/天解锁文章

评论 21

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。