Monodepth2口臭学习记录2

最新推荐文章于 2022-07-07 18:27:19 发布

CarsimLn

最新推荐文章于 2022-07-07 18:27:19 发布

阅读量510

点赞数 1

分类专栏：单目几把深度估计文章标签：计算机视觉

本文链接：https://blog.csdn.net/CarsimLn/article/details/123844136

版权

本文介绍了自监督深度估计方法Monodepth2，重点探讨了自监督训练中的图像重投影误差和改进的单像素最小重投影误差策略。通过最小化重投影误差，提升了深度图的质量，尤其是在处理遮挡问题上。此外，还提出了一种自动掩蔽静止像素的方法，以应对相机静止或物体运动时的深度估计挑战。这些改进提高了单目深度估计的精度和鲁棒性。

摘要由CSDN通过智能技术生成

接Monodepth2口臭学习记录1

3.1自监督训练

自监督深度估计将学习问题变成视觉合成问题，通过训练一个网络，从另一个图像的视角来预测目标图像。通过约束网络进行图像合成来作为中间变量，在我们的深度和视差情况中，我们可以从模型中提取出可解释的深度。这个问题确实有点毛病，应为每个像素的确切深度有超级大量的可能，这些像素可以准确的重建全新视图，在给定像个视角相对位姿的前提下。经典的双目和夺目立体方法一般通过促使深度图的光滑度来解决这个问题，并且通过计算图像一致性在patchs（？）当通过全局优化来解决每个像素的深度。【Multi-view stereo: A tutorial.】

于【12，15，76】相同，我们也把我们的问题公式化，表示为最小化图像光度的重投影误差在训练时。从每一个原图到目标图像的位姿转换，Tt-t',深度图Dt，我们预测稠密深度图最小化的图像重投影误差Lp，其中。