twice论文-深度估计-DEEPV2D: VIDEO TO DEPTH WITH DIFFERENTIABLE STRUCTURE FROM MOTION

最新推荐文章于 2024-08-18 10:18:06 发布

molly_d

最新推荐文章于 2024-08-18 10:18:06 发布

阅读量2.1k

点赞数

分类专栏：立体视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dy_happy/article/details/105986562

版权

DEEPV2D是一种融合深度学习与多视图几何的视频深度估计方法，通过可微分的运动估计和深度估计两个阶段，实现端到端的学习。该方法解决了传统SFМ在处理遮挡、光照变化时的局限，以及深度学习网络难以处理帧间联系的问题。通过交替优化深度模块和运动模块，实现更准确的深度和运动估计。

摘要由CSDN通过智能技术生成

使用可微分的sfm求得视频中的深度

0 摘要：

说的是讲深度学习和图像的几何原理结合起来进行端到端的学习，分为两个阶段：运动估计和深度估计

1 介绍：

就是说从视频中求得深度图，传统的的方法是使用sfm,来求优化求得3D结构和相机的运动，然后将相机的参数放在多视图几何来获得完整的深度。深度学习也在3D重建中效果比较好，他们有些优点吧，可以从单个图片中直接学得深度，而且网络块是可闻分的，可以从数据直接学习。但是一般网络直接从多视图几何图像中来训练时困难的（比如帧之间的联系），所以说将多视图几何的知识嵌入到层或者损失的设计上面是比较好的。

所以本文的工作就是结合神经网络强大的特征表达能力，加上多视图几何的内容来估计深度。

2 相关工作：

sfm:早期设计的为少量图片集，优缺点，在低温里，遮挡，光照变化的情况下，会产生噪声，丢失重要信息。

几何和深度学习：几何原理激发了很多深度学习的设计，需要解决两个问题：深度的估计和运动的估计。

深度：起初是按照立体结合原理设计的端到端的网络：首先是使用2维的卷积网络来提取特征，然后在提取的特征上建立一个代价向量，接着把代价这一维度加在2维的特征上形成3维，来进行特征匹配和正则化，这个思想完全是来自立体几何的原理。然后将这个原理迁移到从多视图中估计3D结构上，但是这些网络需要相机的姿态作为输入，但是视频中我们不知道相机的运动

运动：当然有很多在研究这个问题，对于运动估计的网络典型的是运用一般的网络构建，我们使用最小二乘法来

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。