Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN；视频笔记

最新推荐文章于 2023-12-27 11:05:11 发布

非正经研究生

最新推荐文章于 2023-12-27 11:05:11 发布

阅读量862

点赞数 2

分类专栏： # 单目测距深度学习文章标签：深度学习神经网络 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/paulkg12/article/details/120082738

版权

深度学习同时被 2 个专栏收录

25 篇文章 0 订阅

订阅专栏

19 篇文章 3 订阅

订阅专栏

tags: 单目深度估计,论文阅读,DORN

原始论文是：

Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1

在线看论文：

https://arxiv.org/pdf/1806.02446.pdf

在线看代码

过往的DCNN方法的失败之处

过往的工作（特指那些使用深度神经网络的：DCNN）方法的3种失败处：

收敛慢
局部解析度不够，就是你在最后的深度图上，看不清很多边缘
网络里面有许多重复的 pooling 操作。计算，内存要求多

我们提出一些方法来针对上述问题

方法1: SID

背后的想法就是：远处的就分类粒度粗一些

那么，在这个「SID 远处的就分类粒度粗一些」的基础上，就能把回归问题变成一个分类问题。

离散化连续的距离变为一些距离间隔。

我们的模型包含什么

分成3个模块

特征提取的模块
场景理解的模块
有序回归的模块

特征提取模块

包含：

全面的图片编码器

full-image encoder

场景理解模块

ASPP

空洞卷积？？

有序回归模块

这里就是用到了SID

上图说的 eq1
，等式 1 ，就是：

在这里插入图片描述

如何完成学习和推断

学习阶段

定义我们特有的损失函数：

迭代的优化算法，反向传播，我们最后就能得到一个「有序的 label 分类」，每个类就是一个距离，比如：1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离跟上面的SID 有关。

推断阶段

有了：有序的 label 分类，就可以进行距离推断。

用下面的公式：

如何基于 label 分类，来推断距离的公式

解释一下：

d 尖就是推测的 depth/ 距离

l 就是学习到的label

DORN 的表现很好

在18 年的原始论文里，有这个数据：

在 21年的 kitti 排行榜，很靠前

其实，按照 absRel ， DORN 排名第一

备注：指标解释

更多相关可以读的博客：

todo 2021-09-08 16:45:30

论文详细笔记

2019CVPR单目深度估计综述

DORN的论文行文不好，但是看看代码，思路还是挺牛逼的，来自2020年看法

这篇论文在ROB2018的视频

过往的方法

patch
eigen; loss function;

regression loss

我们的方法

是 ordinal regression loss

loss functions

MSE

mean square error:

在这里插入图片描述

但是 mse 这玩意的不好的地方就是：对于 outliers ，也就是那些离开群体的点，它很敏感，很容易受离群点的影响。

更加 robust 的loss function

mse_log

在这里插入图片描述

mae

在这里插入图片描述
这些 loss 函数，都是为了 regression 设计的。

那么我们有一个发问：

难道不能设计分类，有序回归问题的loss 函数吗？

距离的离散化

在这里插入图片描述
在这个图片，地下的 sid 就是我们提出的间隔话的方式。

就会得到这样的回归结果

在这里插入图片描述

收敛速度

在这里插入图片描述

多解析架构；网络部分

在这里插入图片描述

多尺度特征提取器

在这里插入图片描述

四个评价指标

在这里插入图片描述

结果

在这里插入图片描述

提问环节的一些记录

如果更换一个全新的场景怎么办？

训练是用 kitti 和 cityscape 这两个数据集‘

但是如果其他场景呢？比如更加 landscape 的场景；

回答是：

你需要自己进行新的标注；因为这是一个有监督的算法；

你用了什么 loss function？

我用了图中的第一个

后面三个没用

在这里插入图片描述

loss 函数和离散化谁更重要？

它们在我们的工作中都贡献了许多，但是我觉得 loss 函数会更加重要一些。

多分类器，以及空间增加的离散化，的对比实验

在这里插入图片描述

结论都写在图中的底下两行了。

dorn + sid 就是会好很多。

更多可以观看的视频

todo : 2021-09-08 16:37:37

通过视频序列进行深度估计

在Azure上的「有序回归」学习

非正经研究生

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN；视频笔记

tags: 单目深度估计,论文阅读,DORN文章目录@[toc]我们提出一些方法来针对上述问题方法1: SID我们的模型包含什么特征提取模块全面的图片编码器场景理解模块ASPP有序回归模块如何完成学习和推断学习阶段推断阶段DORN 的表现很好备注：指标解释原始论文是：Deep Ordinal Regression Network for Monocular Depth Estimation Deep Ordinal Regression Network for Monocular Depth E
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。