Cvpr24《Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation》
传统的单目深度估计模型往往在处理含有不熟悉内容和布局的图像时表现不佳,因为它们的视觉知识受限于训练数据,尤其在面对新领域的零样本(zero-shot)泛化时更是如此。尽管当前的单目深度估计模型已经从CNN发展到大型视觉Transformer,但依然存在泛化能力不足的问题。为此,作者提出了一个新的方法,名为 Marigold,它利用了现代生成式扩散模型中丰富的视觉先验知识,特别是基于Stable Diffusion模型的改进。
原创
2024-09-04 16:37:13 ·
479 阅读 ·
0 评论