depth in the wild学习记录

最新推荐文章于 2024-08-07 10:11:48 发布

CarsimLn

最新推荐文章于 2024-08-07 10:11:48 发布

阅读量446

点赞数

分类专栏：单目几把深度估计文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CarsimLn/article/details/124379297

版权

单目几把深度估计专栏收录该内容

8 篇文章 3 订阅

订阅专栏

论文介绍了一种单目视觉方法，通过相邻帧一致性训练深度估计网络，同时解决遮挡问题并学习相机内参，包括焦距、偏移和畸变。关键创新包括遮挡处理、深度图直接使用和随机层归一化。研究者首次实现了运动物体的区分和相机参数估计。

摘要由CSDN通过智能技术生成

摘要：同时学习深度、自我运动、物体运动、和相机内参来自单目视贫，仅仅使用视频中相邻帧之间的一致性来监督。几个创新点：我们几何的、可微的解决遮挡，直接使用深度图，我们引入随机层归一化，我们解释物体相对于场景的运动。我们是第一个学习相机内参的方法，包括畸变。

Preliminaries：

z′p′ = KRK^(-1)zp + Kt

p:position z:depth R、T外参

Method：

1.一个运动估计网络，估计相机运动，每个像素相对于背景的运动，相机内参包括焦距、偏移和失真。

2.一个深度估计网络。通过施加帧之间一致性的损失，网络同时学习深度、运动场和相机内参。

3.根据估计的深度图几何地估计遮挡，而且仅把帧间一致性损失放到应用在无遮挡的像素上。

4.利用分割、目标检测网络估计运动物体。

网络：ResNet-18

损失：。。。

Occlusion-aware consistency：

遮挡的发生——深度不一致。

颜色和深度一致性需要应用在重构的图像的可见部分。

获知遮挡物体的方法：仅当warp到的图像上像素点的深度z′R ≤ zL或者z′L ≤ zR时，将光度误差和几何误差应用到该像素。也就是只考虑源图像的深度图在前面的像素点。

正则化：训练中的一些方法。以及，运动物体的处理方式。

本文中假设R是固定的，也就是说每帧之间只存在平移。使用一个可能移动的掩码m(x, y)描述了物体运动：

t(x, y) = t0 + m(x, y)δt(x, y),

其中t0时背景运动，δt(x, y)是残余运动（基于运动物体），m(x, y)由目标检测粗糙的获得。

今晚看论文，看他具体是怎么搞的

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
depth in the wild学习记录

摘要：同时学习深度、自我运动、物体运动、和相机内参来自单目视贫，仅仅使用视频中相邻帧之间的一致性来监督。几个创新点：我们几何的、可微的解决遮挡，直接使用深度图，我们引入随机层归一化，我们解释物体相对于场景的运动。我们是第一个学习相机内参的方法，包括畸变。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。