读论文 Unsupervised cnn for single view depth estimation Geometry to the rescue

最新推荐文章于 2024-03-03 10:14:59 发布

非正经研究生

最新推荐文章于 2024-03-03 10:14:59 发布

阅读量378

点赞数

分类专栏： # 单目测距文章标签： cnn 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/paulkg12/article/details/120666452

版权

单目测距专栏收录该内容

19 篇文章 3 订阅

订阅专栏

在这里插入图片描述

它干了啥

提出了一种方法，进行单目深度估计，以后再也不用大量提前标注的数据了。因为，算是一种自监督吧。

采用了 autoencoder 方法，用两张图，用其中一张，预测深度map，然后用深度和已知的两个相机的位置，这些外部参数，就能算出来另外一张图，算出来的这个 fake 的图，叫做重建图。

重建图和真实的源图，之间的差异，就可以通过重建损失进行表示。

天天对原文的笔记

第一部分：介绍

说了之前的训练手法：

先在 image net 上进行训练，
然后微调，以适应其他任务。

说了说自己的工作：目标是学会一个非线性的预测函数：把 image 直接给映射到 depth map

场景的depth ，cnn 是如何学习到的呢？有几个线索：图片的问题，场景的语义，局部和全局的信息；

有监督的 cnn 都在尝试最小化那些 loss，比如：与真实值的 scale invariant RMS, 或者 log RMS

有监督的训练，是需要 rgb 的颜色图，以及对应的 depth map，比如 NYUv2 和 KITTI 就是这种数据集

但是有个问题，不能泛化

在室内室外数据集得到的模型，不能对换着用。你必须得【重新训练】，才能把室内的模型用到室外。

尽管有人用合成的数据来进行这种【重新训练】，但是也是挺费的。

所以用个新方法吧：立体图片

大量的立体图片，可以生成大量的 image-plus-disparity-map。

然后我们让网络学着去预测这个 disparity map；

但是这个任务也有几个问题，需要咱们注意：

传感器 flare，抽了
动态的模糊，照片糊了！
光照的改变，闪瞎眼了
阴影，阴天可咋办

这些问题，在立体图像来算 depth 的时候，你都要考虑

本文的灵感来自 autoencoder

以及众所周知的视觉几何学（大概就是说从 disparity map 和左图揉在一起生成右图的科学技术）

如此，我们在最后投入使用，测试的阶段，就得到一个牛逼的东西：完全无监督的，端到端的，卷积神经网络，仅仅用立体图像中的一张图片，进行深度估计。

第二部分：论文的方法详情

大概画个图就这样：

在这里插入图片描述

2.1 编码器的loss

两个：

1是：在这里插入图片描述
2是
最后合并 1，2 就是了

再来个图：

在这里插入图片描述

第三部分：skip 让我从垃圾变精良

双线性采样

第四部分：网络架构图

在这里插入图片描述

第五六七部分，做实验

证明我很厉害

网络的架构

在这里插入图片描述

从这篇文章引申出来的其他文章

19: alexNet； Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classiﬁcation with deep con-volutional neural networks. In: Advances in Neural Information Processing Systems (NIPS) (2012)

论文位置：

https://www.jianguoyun.com/p/DT3CBsYQvYjwBhjK7ZEE

https://arxiv.org/pdf/1603.04992.pdf

参考了：

https://zhuanlan.zhihu.com/p/85029339

模型代码

https://github.com/Ravi-Garg/Unsupervised_Depth_Estimation

非正经研究生

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。