BMVC‘24开源 | BaseBoostDepth：更强大的自监督单目深度估计

最新推荐文章于 2024-10-13 11:30:35 发布

计算机视觉工坊

最新推荐文章于 2024-10-13 11:30:35 发布

阅读量109

点赞数

分类专栏： 3D视觉从入门到精通文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46788581/article/details/140965964

版权

3D视觉从入门到精通专栏收录该内容

368 篇文章 19 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

0. 这篇文章干了啥？

几十年来，深度估计一直是计算机视觉领域的一个基本要素，在自动驾驶、虚拟现实、机器人技术和场景重建等领域有着广泛的应用。虽然多视图几何的原理早已为人所知，但深度学习的兴起使得单视图深度预测成为可能。

大多数用于单目深度估计的自监督方法都使用光度损失来评估连续视频帧之间的视图合成，这与传统的监督学习不同，后者依赖于从激光雷达等昂贵传感器获取的显著真实深度数据。自监督方法因其成本效益而备受关注，因为它们消除了对真实数据的需求。因此，由于可用视频数据的丰富性，它们可以在更大的数据集上进行训练，从而提高了泛化能力，如先前研究所示，与监督方法相比具有优势。

然而，在自监督方法中，基线宽度的重要性尚未得到与多基线立体视觉领域相同程度的探索。在多基线立体视觉中，存在一个一致的趋势：较窄的基线会带来更容易的像素匹配问题，但会导致较差的深度估计。

尽管较宽的基线在准确性方面具有潜在优势，但当前的自监督单目深度（SSMD）方法，如Monodepth2（MD2），在其重建过程中使用了较窄的基线。MD2通过使用包含一个后续帧和一个先前连续帧的源图像来重建目标图像。此外，它还利用与目标图像相关的窄立体帧来辅助重建过程。尽管可以使用更大的单目基线，但Lokender等人的研究表明，在更大的时间窗口上使用更宽的基线会带来诸如亮度不一致和遮

了解本专栏

超级会员免费看

计算机视觉工坊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。