Monodepth2口臭学习记录2

本文介绍了自监督深度估计方法Monodepth2,重点探讨了自监督训练中的图像重投影误差和改进的单像素最小重投影误差策略。通过最小化重投影误差,提升了深度图的质量,尤其是在处理遮挡问题上。此外,还提出了一种自动掩蔽静止像素的方法,以应对相机静止或物体运动时的深度估计挑战。这些改进提高了单目深度估计的精度和鲁棒性。
摘要由CSDN通过智能技术生成

接Monodepth2口臭学习记录1

3.1自监督训练

自监督深度估计将学习问题变成视觉合成问题,通过训练一个网络,从另一个图像的视角来预测目标图像。通过约束网络进行图像合成来作为中间变量,在我们的深度和视差情况中,我们可以从模型中提取出可解释的深度。这个问题确实有点毛病,应为每个像素的确切深度有超级大量的可能,这些像素可以准确的重建全新视图,在给定像个视角相对位姿的前提下。经典的双目和夺目立体方法一般通过促使深度图的光滑度来解决这个问题,并且通过计算图像一致性在patchs(?)当通过全局优化来解决每个像素的深度。【Multi-view stereo: A tutorial.】

于【12,15,76】相同,我们也把我们的问题公式化,表示为最小化图像光度的重投影误差在训练时。从每一个原图到目标图像的位姿转换,Tt-t',深度图Dt,我们预测稠密深度图最小化的图像重投影误差Lp,其中。

这里多了个图像重投影误差,需要主要重投影误差和重建误差的区别?

其中pe是图像光度重构误差,比如像素空间的L1距离,proj()是最为结果的2D坐标属于投射的深度Dt在图像 It‘种,然后<>是采样操作。简化符号,我们假设所有视角的内参K是相同的,(其实是不一样的,苟)。对这【21】我们使用双线性采样来采样源图像,使其局部可微&#x

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值