[算法整理]可能是最全的无监督/自监督单目深度估计方法汇总 - Part1:视频序列篇

正在变胖的喵喵

已于 2022-06-21 16:25:35 修改

阅读量5.4k

点赞数 5

分类专栏：模型&算法分析文章标签：深度学习自动驾驶 pytorch 计算机视觉

于 2022-04-16 20:46:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41625823/article/details/123908243

版权

[算法整理] 可能是最全的自监督/无监督单目深度估计方法汇总 - Part1:视频序列篇

背景

借着最近开题写开题报告的机会，比较细致地整理了一下之前看过的自监督单目深度估计相关的论文。合计了一下，感觉写篇综述有点太耗时耗力，干脆就在这里分享出来好了。
论文列表持续更新中

2022.4.16：视频序列篇-单任务方法：19篇
视频序列篇-多任务方法
双目图像篇

广告时间：SMDE-Pytorch

一个基于Pytorch的自监督单目深度估计开发、训练和测试开源工具箱
GitHub
由于近一年都在做自监督单目深度估计的相关工作，自己也动手尝试了不少代码。但自监督单目深度估计一直没有一个像MMsegmentation一样的囊括各种方法的开发工具箱。既然没有那就自己造一个！

对于只是想尝试或者体验一下效果的人，该工具箱可以通过简单的配置和命令实现对你自己图像的深度估计。
对于科研工作者，该工具箱中提供最近流行方法的预训练模型，以及统一的测试代码，可以方便地进行对比。
对于想进一步开发的人，该工具箱可以方便地替换网络结构，损失函数等部分，让你更快速地进行探索和实验（尽请期待）。

工具箱内容持续更新中
如果你对这个工具箱感兴趣，或者觉得这篇汇总有帮助，请到我们的GitHub仓库上留下一个Star催更~

自监督学习的单目深度估计

单目深度估计的目标是从一幅给定的图像中预测一幅深度图，表示图像中每个像素对应的场景与相机之间的距离。基于自监督学习的单目深度估计方法使用深度网络模型完成稠密深度的预测，并且在训练阶段不需要带有深度真值的训练样本，而采用视频序列中的连续帧或双目相机拍摄的图像对作为输入，以图像重建作为目标对深度网络模型进行训练。
根据训练时使用的样本形式，基于自监督学习的单目深度估计方法可以大致被分为两类：采用视频序列训练的方法和采用双目图像训练的方法。

采用视频序列训练的方法

采用视频序列训练的方法在训练阶段以视频序列中的连续帧作为训练样本。由于连续帧之间的相机运动是未知的，这些方法在训练阶段除了估计目标图像的深度图之外，还需要估计目标图像与源图像之间的相机运动。

单任务方法

1.Unsupervised learning of depth and ego-motion from video （CVPR 2017）

原文链接
关键词：同时预测深度和相机运动、可学习的动态场景Mask
主观

最低0.47元/天解锁文章

正在变胖的喵喵

关注

5
点赞
踩
63

收藏

觉得还不错? 一键收藏
2
评论
[算法整理]可能是最全的无监督/自监督单目深度估计方法汇总 - Part1:视频序列篇

[算法整理]可能是最全的自监督/无监督单目深度估计方法汇总 - Part1:视频序列篇背景。比较细致地整理了一下之前看过的自监督单目深度估计相关的论文。论文列表持续更新中。
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。