twice论文-深度估计-DEEPV2D: VIDEO TO DEPTH WITH DIFFERENTIABLE STRUCTURE FROM MOTION

DEEPV2D是一种融合深度学习与多视图几何的视频深度估计方法,通过可微分的运动估计和深度估计两个阶段,实现端到端的学习。该方法解决了传统SFМ在处理遮挡、光照变化时的局限,以及深度学习网络难以处理帧间联系的问题。通过交替优化深度模块和运动模块,实现更准确的深度和运动估计。
摘要由CSDN通过智能技术生成

使用可微分的sfm求得视频中的深度

0 摘要:

说的是讲深度学习和图像的几何原理结合起来进行端到端的学习,分为两个阶段:运动估计和深度估计

1 介绍:

就是说从视频中求得深度图,传统的的方法是使用sfm,来求优化求得3D结构和相机的运动,然后将相机的参数放在多视图几何来获得完整的深度。深度学习也在3D重建中效果比较好,他们有些优点吧,可以从单个图片中直接学得深度,而且网络块是可闻分的,可以从数据直接学习。但是一般网络直接从多视图几何图像中来训练时困难的(比如帧之间的联系),所以说将多视图几何的知识嵌入到层或者损失的设计上面是比较好的。

所以本文的工作就是结合神经网络强大的特征表达能力,加上多视图几何的内容来估计深度。

2 相关工作:

sfm:早期设计的为少量图片集,优缺点,在低温里,遮挡,光照变化的情况下,会产生噪声,丢失重要信息。

几何和深度学习:几何原理激发了很多深度学习的设计,需要解决两个问题:深度的估计和运动的估计。

深度:起初是按照立体结合原理设计的端到端的网络:首先是使用2维的卷积网络来提取特征,然后在提取的特征上建立一个代价向量,接着把代价这一维度加在2维的特征上形成3维,来进行特征匹配和正则化,这个思想完全是来自立体几何的原理。然后将这个原理迁移到从多视图中估计3D结构上,但是这些网络需要相机的姿态作为输入,但是视频中我们不知道相机的运动

运动:当然有很多在研究这个问题,对于运动估计的网络典型的是运用一般的网络构建,我们使用最小二乘法来

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值