UnOS: Unified Unsupervised Optical-flow and Stereo-depth Estimation by Watching Videos论文解读

最新推荐文章于 2024-10-24 18:16:51 发布

春江水暖谁先知

最新推荐文章于 2024-10-24 18:16:51 发布

阅读量938

点赞数 2

分类专栏： VO视觉里程计文章标签：自动驾驶神经网络机器学习深度学习 tensorflow

本文链接：https://blog.csdn.net/qq_37748370/article/details/104533160

版权

UnOS框架通过使用CNN无监督地联合训练光学流和深度，利用视频中的连续图像对，通过三个并行网络估计深度图、相机运动和光学流。文章介绍了如何通过刚性场景的几何一致性来估计光学流和深度，并提出RDVO模块增强光流与刚性光流的几何一致性。该方法应用于自动驾驶领域的视觉估计。

摘要由CSDN通过智能技术生成

UnOS: Unified Unsupervised Optical-flow and Stereo-depth Estimation by论文解读(个人理解)

摘要

本文提出了一个UNOS的框架，即通过光流和深度在刚性场景假设下的内在几何一致性，由CNN来无监督地联合训练光流和深度。它是由来自视频中的连续的图像对，再由UNOS中的三个平行的网络（Stereo Net、Motion Net and Flow Net）来分别估计出深度图、相机自我运动和光流。再由相机的自我运动和深度图就可以计算出刚性光流，然后再与从Flow Net中估计出来的光流作比较；就可以产生满足刚性场景假设的像素。因为要加强在刚性区域内光流和刚性光流之间的几何一致性，所以导出了一个rigid-aware direct visual odometry（ RDVO）模块。当然在UNOS的学习中，也考虑到了刚性和遮挡感知流一致性。

介绍：

本文主要是由无监督的方法来联合学习光流和深度，通过它们之间的几何一致性来训练参数。而许多其他的论文都是分开学习和训练光流和深度的。UNOS的大体结构框架如下图所示：

在这里插入图片描述
在训练期间，会从视频中获取连续的两对图像对Ls、Rs和Lt、Rt。UNOS将会从Motion Net 、Stereo Net和Flow Net中估计出深度图Dt、相机的自我运动Tt_s和光流Ft_s。然后RDVO将会在Moti

最低0.47元/天解锁文章

春江水暖谁先知

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录