BMVC‘24开源 | BaseBoostDepth:更强大的自监督单目深度估计

0. 这篇文章干了啥?

几十年来,深度估计一直是计算机视觉领域的一个基本要素,在自动驾驶、虚拟现实、机器人技术和场景重建等领域有着广泛的应用。虽然多视图几何的原理早已为人所知,但深度学习的兴起使得单视图深度预测成为可能。

大多数用于单目深度估计的自监督方法都使用光度损失来评估连续视频帧之间的视图合成,这与传统的监督学习不同,后者依赖于从激光雷达等昂贵传感器获取的显著真实深度数据。自监督方法因其成本效益而备受关注,因为它们消除了对真实数据的需求。因此,由于可用视频数据的丰富性,它们可以在更大的数据集上进行训练,从而提高了泛化能力,如先前研究所示,与监督方法相比具有优势。

然而,在自监督方法中,基线宽度的重要性尚未得到与多基线立体视觉领域相同程度的探索。在多基线立体视觉中,存在一个一致的趋势:较窄的基线会带来更容易的像素匹配问题,但会导致较差的深度估计。

尽管较宽的基线在准确性方面具有潜在优势,但当前的自监督单目深度(SSMD)方法,如Monodepth2(MD2),在其重建过程中使用了较窄的基线。MD2通过使用包含一个后续帧和一个先前连续帧的源图像来重建目标图像。此外,它还利用与目标图像相关的窄立体帧来辅助重建过程。尽管可以使用更大的单目基线,但Lokender等人的研究表明,在更大的时间窗口上使用更宽的基线会带来诸如亮度不一致和遮

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值