特斯拉都在用的深度算法：Unsupervised Learning of Depth and Ego-Motion from Video

最新推荐文章于 2024-05-23 17:12:39 发布

auto-mooc

最新推荐文章于 2024-05-23 17:12:39 发布

阅读量653

点赞数

文章标签：算法人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/auto_mooc/article/details/131163491

版权

基于自监督学习的单目深度+位姿估计的经典框架，成为最基本的自监督学习的范式。后来提出的许多自监督方法都以此为基础。

提出了一个无监督的学习框架，用于任务的单眼深度和摄像机运动估计的非结构化视频序列。我们使用端到端学习方法，以视图合成作为监督信号。与之前的工作相比，我们的方法是完全无监督的，只需要单眼视频序列进行训练。我们的方法使用单视图深度和多视图姿态网络，基于使用计算的深度和姿态扭曲附近的视图到目标的损失。因此，网络在训练过程中被损失耦合，但可以在测试时独立应用。对KITTI数据集的经验评估证明了我们的方法的有效性：
1)单眼深度与使用地面真实姿态或深度进行训练的监督方法进行比较;
2)在类似的输入设置下，姿态估计的性能优于已建立的SLAM系统。

人类在估计自身运动和场景的三维结构方面有出色的能力；但是几何计算机视觉的研究，在非刚性的、闭塞的或者缺乏纹理的真实场景上无法创造类似于人类能力的模型。

为什么人类能表现的如此出色呢？

一种假设是，我们通过过去的视觉经验对世界形成了丰富的、结构化的理解，这主要包括四处移动和观察大量场景，并对我们的观察形成一致的模型。

在数百万次这样的观察中，我们认识着世界的规律——道路是平的，建筑物是直的，汽车是在道路上行驶的等等。我们可以将这些知识应用到感知一个新场景时，甚至是从一个单目图像中。

我们通过训练图像序列的模型来模拟这种方法，预测可能的相机运动和场景结构来解释看到的图像序列。
我们采用端到端方法，允许模型直接从输入像素映射到自我运动场景结构。

在这里插入图片描述

只有当几何视图合成系统对于场景几何和相机位姿的估计符合真实情景，才能稳定地有好的表现。
因此，我们的目标是将整个视图合成的过程表述为卷积神经网络的推理过程。

通过训练大规模视频数据的网络来完成视图合成的“元”任务，迫使网络学习深度和相机位姿估计的中间任务，以提出对视觉感知真实世界的一致性解释。
在这里插入图片描述

在此，我们提出了一个框架，以联合训练一个单视图深度 CNN和一个摄像机姿态估计CNN从未标记的视频序列。尽管深度模型和姿态估计模型经过了联合训练但它们可以在测试时间推断中独立使用。我们的模型的训练例子由移动摄像机捕捉的场景的短图像序列。而我们的训练过程在某种程度上对场景是稳健的。
在这里插入图片描述
框架可以应用于没有姿态信息的标准视频。此外，它还预测了姿态作为学习框架的一部分。展示了我们的深度和姿态估计的学习通道。

我们提出了一个端到端学习通道，利用视图合成任务监督单视角深度和相机姿态估计。该系统在未标记的视频上进行训练，但表现与需要地面真实深度或姿势进行训练的方法相当。

尽管该方法在基准评价方面表现良好，但还远远不能解决三维场景结构推理的无监督学习问题。
一些重大问题和挑战如下：

（1）我们的模型没有显式地估计场景中的动态和遮挡（隐式地被可解释性掩码考虑在内），而这两个问题都是3D场景理解的重要因素。通过运动分割直接建模动态场景可能是一种方案。

（2）我们的方法假定相机内参是给定的，这就限制了实际情况中未知相机的视频序列估计（作者说他们计划在未来工作中解决这个问题）。

（3）深度图是真实3D场景的简化表示。扩展此模型去学习3D体积表示(full 3D volumetric representations)是有趣的方向。

未来工作的一个有趣方向是更深入地研究我们的自监督系统学习到的表示。特别是位姿估计网络倾向于从图像相关性来学习相机位姿，而深度估计网络可能识别场景和物体的共同特征。或者将我们的工作重新用于对象检测或者语义分割等任务。

原论文学习，可以私信D主

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
特斯拉都在用的深度算法：Unsupervised Learning of Depth and Ego-Motion from Video

基于自监督学习的单目深度+位姿估计的经典框架，成为最基本的自监督学习的范式。后来提出的许多自监督方法都以此为基础。
复制链接

扫一扫

auto-mooc CSDN认证博客专家 CSDN认证企业博客

码龄3年

清研车联信息科技（苏州）有限公司

26: 原创

73万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

562: 积分

202: 粉丝

258: 获赞

17: 评论

458: 收藏

私信

关注

热门文章

分类专栏

自动驾驶控制算法 1篇

最新评论

电动汽车BMS 充电干扰问题分析及排除
jùn: 这个是什么PCB仿真软件，方便推荐一下吗
敏捷开发方法在汽车电控软件开发中的应用
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题“敏捷开发方法在汽车电控软件开发中的应用”非常吸引人。您对敏捷开发方法在汽车电控软件开发中的应用进行了深入的探讨，这给我们带来了很多启发。在下一步的创作中，我建议您可以结合实际案例，更加具体地阐述敏捷开发方法在汽车电控软件开发中的应用，这将使读者更容易理解和应用这些方法。同时，也期待您能够分享一些您在实践中遇到的挑战以及解决方案，这将使您的博客更具实用性。祝愿您在创作的道路上继续前行，带给我们更多有价值的内容！
汽车软件开发V流程
CSDN-Ada助手: 恭喜您写下了第11篇博客！标题中的“汽车软件开发V流程”非常引人注目。从您的博客内容来看，您对汽车软件开发流程有着深入的了解，这对读者来说无疑是一份宝贵的资料。不过，我敢说您的创作之路还远远不止于此！希望您能继续保持持续创作的热情，为我们带来更多精彩的博客。如果可能的话，下一步您可以考虑探讨一些具体案例，为读者提供更多实践经验和解决方案。谦逊之心永远是我们成长的动力，期待您的下一篇博客！
让端到端智驾算法从梦想照进现实——自动驾驶大模型，一个模型全都搞定
CSDN-Ada助手: 恭喜您写完了第12篇博客！标题也非常吸引人，让我对端到端智驾算法产生了浓厚的兴趣。您的文章内容真正让我相信，自动驾驶大模型可以成为现实。不仅仅是梦想，而且您还提到一个模型就可以搞定。这真是令人振奋！在接下来的创作中，或许您可以考虑分享一些关于端到端智驾算法的实践案例或者更详细的技术细节。这样可以进一步帮助读者们深入了解这个领域，并且从中获得更多的启发。当然，这只是我的建议，您的创作方向一定会更加精彩。期待您的下一篇博客！
电动汽车BMS 充电干扰问题分析及排除
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“电动汽车BMS 充电干扰问题分析及排除”非常吸引人。您的文章内容丰富，深入探讨了电动汽车BMS充电干扰问题，并提供了解决方法，对读者来说非常有价值。在下一步的创作中，我建议您可以进一步探索电动汽车BMS充电干扰问题的实例，并分享更多实践经验和解决方案。此外，您可以考虑添加一些相关的技术原理和背景知识，以帮助读者更好地理解问题的本质。再次感谢您的分享，期待您在未来的创作中继续展示您的专业知识和见解！请继续保持谦虚的态度，我们期待您的新作品。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。