Monodepth2 ：Digging Into Self-Supervised Monocular Depth Estimation 阅读笔记

最新推荐文章于 2024-04-24 14:34:59 发布

Katzelala

最新推荐文章于 2024-04-24 14:34:59 发布

阅读量816

点赞数

分类专栏：深度学习 SLAM python 文章标签：计算机视觉深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41790566/article/details/106167199

版权

python 同时被 3 个专栏收录

15 篇文章 1 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

文章使用深度网络和姿态网络。深度网络是U-Net 编码器-解码器模型结构。

编码器是经过预训练的ResNet模型，解码器能够将输出转化成深度值，这个深度值是一个归一化的相对深度，即离相机越近，值越接近0，无穷远接近1。可用深度图表示。

使用两个彩色图像作为输入来预测单个6自由度相对姿势或旋转和平移参数。单个图像作为输入来预测深度。

理解U-net：U-net是一种编码器-解码器结构，最初应用于图像分割。与传统CNN不同，之前见到的CNN往往用于分类，相当于输入一个图像，CNN层层提取特征图，最后通过两个全连接层拉成向量，用向量表达各个分类的概率。

而用于图像分割的则不同，因为最后要得到的是一个被分割的图像，因此

1 最后输出的尺寸必须是与原图一致的

2 我们可以把这个过程理解成求解一个映射，输入原图I，输出被分割的图像seg。

因此最后不能使用全连接层，而是用卷积层进行替代，那么这个网络完全由卷积层构成，编码的部分称为全卷积网络（FCN）

从FCN恢复出分割图：那么FCN得到特征图之后如何恢复成分割的图像呢。得到的高维特征图是比原图小的，因此文章采用了上采样的方法来将特征图恢复到原始图像的大小。也就是将高维特征图翻译成原图时对应的分割图像

恢复的过程并不是单纯的上采样，我们认为浅层的网络更关注于细节信息，高层的网络更关注于语义信息，因此融合了几个不同深度的预测（跳级skip），个人认为这一块是特征金字塔网络FPN的思想。这里的融合是像素级（element-wise）的融合。

参考：
https://blog.csdn.net/Formlsl/article/details/80373200

https://blog.csdn.net/qq_36269513/article/details/80420363

对文章的主要贡献的理解：

1.auto-mask技术，加在loss上，减少相对相机静止的物体（包括无穷远点）的影响。

这种mask是二进制的。对于某一些静止像素，相机静止，或是低纹理区域，如果目标图像t和源图像s之间的光度误差小于目标图像和恢复出的目标图像的光度误差，那么光度误差系数则为1，否则为0。相机静止的时候整个帧都会被过滤掉。这一段我的理解是目标图像和源图像光度误差很小，说明两帧之间这个像素没有变化，没有移动，那么就可以直接过滤掉。

2.用深度图修正光度重建误差。

这一思想可以参考17年的论文sfm-learner。将深度估计和位姿估计通过相机内参数联系到一起。

3 多尺度深度估计。

这一点参见FPN的思想。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Monodepth2 ：Digging Into Self-Supervised Monocular Depth Estimation 阅读笔记

文章使用深度网络和姿态网络。深度网络是U-Net 编码器-解码器模型结构。编码器是经过预训练的ResNet模型，解码器能够将输出转化成深度值，这个深度值是一个归一化的相对深度，即离相机越近，值越接近0，无穷远接近1。可用深度图表示。使用两个彩色图像作为输入来预测单个6自由度相对姿势或旋转和平移参数。单个图像作为输入来预测深度。理解U-net：U-net是一种编码器-解码器结构，最初应用于图像分割。与传统CNN不同，之前见到的CNN往往用于分类，相当于输入一个图像，CNN层层提取特征图，最后通过
复制链接

扫一扫

专栏目录

博客等级

码龄6年

97
原创

272
点赞

471
收藏

80
粉丝

关注

私信

热门文章

分类专栏

Windows 3篇
故障排查 3篇
深度学习 11篇
Office 8篇
BUG 35篇
前端 31篇
python 15篇
pytorch 13篇
算法 2篇
tensorflow 3篇
SLAM 5篇
安装文档 21篇

最新评论

word滑动时出现花屏/黑线
Gloria_zxy: 我靠太牛了！！感谢
pycharm所有文件名字标红
T183339719xx: 为什么我这里还是不能跳转，而且再次打开还是爆红？
报错 cannot import name ‘Optional‘ from ‘torch.jit.annotations‘
卡尔灬: python 3.7.0, torch 1.6.0, torchvision 0.7.0 仍然有此问题
Word无法启动转换器RECOVR32.CNV
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。
Word无法打开文件，因为文件格式与文件扩展名不匹配
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。