Depth Estimation 论文及代码汇总，持续更新中~~

置顶

john_bh

已于 2024-06-12 14:39:55 修改

阅读量1k

点赞数 14

分类专栏： Depth Estimation 文章标签： Depth Depth Anything DepthEstimation MDE

于 2024-03-16 15:47:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/john_bh/article/details/130510299

版权

本文汇总了2024年关于深度估计的最新研究，包括Depth Anything、PatchFusion等方法。这些方法旨在解决高分辨率图像的深度估计、数据扩增、语义信息融合等问题，提升模型的泛化能力和鲁棒性。各方法通过不同的技术手段，如一致性训练、补丁融合、跨光谱融合等，实现了在不同场景下的深度估计性能提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转载请注明作者和出处：http://blog.csdn.net/john_bh/

** Depth Estimation 论文及代码汇总，持续更新中~~**

文章目录

1. Data
2. Metrics
3. 比赛
4. Paper List
- 4.1 Survey
- 4.2 Papers
- - 2024
  - 2023
  - 2022

1. Data

NYUv2
Middlebury
RGBDD

2. Metrics

3. 比赛

4. Paper List

4.1 Survey

4.2 Papers

2024

Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data — CVPR_2024 — code

本文提出了非常实用鲁棒的单目深度估计方法—Depth Anything。文章的目标是不追求新技术模块的情况下，构建一个简单有效的基础模型，用于处理任意环境的任何图片。为此目的设计的数据引擎，可以搜集和自动标注大规模未标注的数据，极大地扩大了数据集，拥有大量数据集能够减少泛化误差。作者研究了两种简单有效的扩大数据的策略，首先，利用数据增强工具创建一个更具挑战性的优化目标，该目标迫使模型积极寻求额外的视觉信息并获得鲁棒的表示；其次，开发了一种辅助监督来强制模型从预训练的编码器继承丰富的语义先验信息。广泛评估了策略的零样本能力，包括了六个公共数据集和随机捕获的照片。Depth Anything展示了令人印象深刻的泛化能力。此外，通过使用来自NYUv2和KITTI的度量深度信息对其进行微调，达到了新的SOTA。
PatchFusion: An End-to-End Tile-Based Framework for High-Resolution Monocular Metric Depth Estimation — CVPR 2024 — code

解决的问题：高分辨率输入的单幅图像 metric 深度估计主流的深度估计模型难以适应当今消费相机和设备中常见的不断提高的分辨率。现有的高分辨率策略显示出前景，但它们往往面临局限性，从错误传播到高频细节的丢失。
如果采用全局下采样方式，该步骤的输出本质上是粗略的，而精细的高频细节会以全局一致性为代价而丢失，提出了一种逐片融合网络，通过高级特征指导，将全局一致的粗糙预测与更精细、不一致的tiled 预测融合在一起的；
如果采用patch-wise 方法可能导致尺度偏移的预测和补丁之间的波动，从而导致明显的补丁伪影，提出一种全局到局部模块，为融合

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。