读论文 The Edge of Depth Explicit Constraints between Segmentation and Depth

最新推荐文章于 2022-12-30 18:52:09 发布

非正经研究生

最新推荐文章于 2022-12-30 18:52:09 发布

阅读量445

点赞数

分类专栏： # 单目测距文章标签：深度学习机器学习自动驾驶

本文链接：https://blog.csdn.net/paulkg12/article/details/120708404

版权

单目测距专栏收录该内容

19 篇文章 2 订阅

订阅专栏

The Edge of Depth: Explicit Constraints between Segmentation and Depth

一句话总结

明摆着用语义来约束深度估计
在这里插入图片描述

本文的思路

本文探索了一个未曾探索的议题：语义分割和深度的边缘，是共享的；
本文的目标在于：令单目自监督的深度估计得到的结果和语义分割的副本更加一致和对齐。

不能把语义边缘和深度边缘的差距当作 loss ，而是会当作一个贪心搜索。
深度图的重建用 Beier–Neely morphing algorithm
语义标签里面存在噪声；所以训练过程需要稳定和提升。方法是：参考立体图像的处理方式，对两张图的里面的 egde 进行 mask，这就会造成一个新的立体遮挡mask 到 loss 里面。
morphing technique: 变种技术；

总结下我们的贡献：

定义，并利用了边缘约束，在语义和深度之间，这让深度边界更加匹配/一致/对应语义边界
减少了 bleeding artifacts, 提升了在物体边界那里的深度预测效果
在自监督方面，实现了 SOTA，在绝对相对误差abs rel 上达到了和有监督的方法媲美的

再度回忆相关的工作

光度上的损失loss，主要可以归纳为两原因：
1，遮挡
2，纹理不清晰的，天空，路，树叶，窗户，无法受到足够的监督信号
怎么解决：
1，一个立体遮挡mask
2. 从语义分割任务里面提供额外的监督信息

一个有效的遮挡 mask 基于单张差异 map 图

额外的modality/形式；
深度预测需要帮助，以前有用表面法线的，语义的，光流的，立体匹配的（33，38）

33 ： Learning monocular depth estimation infusing traditional stereo knowledge. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR),
pages 9799–9809, 2019

38: . Self-supervised monocular depth
hints. In Proceedings of the IEEE International Conference
on Computer Vision (ICCV), pages 2162–2171, 2019.

语义和其他形式对深度估计的辅助不同，因为其他形式可以找到和深度的数学关系，但是语义很难找到跟深度有什么确定的关系。所以之前的工作，都是用语义当作一个暗中帮助的线索，但是我们就是明着用语义。

我们认为之前的工作，是如何用语义的呢？有三种方式用：

共享权重的方式用语义结果，3， 36
混合深度和语义的 feature；27，36，44；CRF：conditional random field
21,31, 用深度和语义的统计关系，建模两者之间的这种不确定性

明着用语义这种形式，来帮助深度估计，需要克服几个问题：

语义和深度实际上，仅仅共享不多的边缘，部分的边缘
写出来一个可微分的函数来连接【二值的】边界，和连续的语义，这挑战很高。
本文的贡献，就在于克服这俩问题。

第三节：本文提出的方法

edge edge consistency loss , 但是这个 loss 不可微分。
circumvent：包围，陷害；得到一个优化的深度图
在训练的时候，，需要立体的图片和实现计算的语义标签。

就是他：明显的深度 - 语义的一致性
T 是一个边缘，定义如下：

在这里插入图片描述

大概的意义我猜是这样的：在左图中，前面的像素遮挡了后面的像素，在右图中，这种遮挡就可能不存在，或者存在很少，但是在大一统的计算过程中，算法还是固执地认为被遮挡的像素，就是原来物体的一部分，于是在最后生成的 disparity图，或者说深度图中，就会出现一个情况：边缘在流血。

bleeding artifact ，原文是这样说的。如何处理这个问题呢？
使用一个遮挡指示矩阵 M

在这里插入图片描述
具体的还是没看懂，现在你可以i知道的结论是：但凡被M认定的区域，都是有可能是被遮挡的，到时候，计算 loss 的时候，这个区域会被特殊处理；我猜啊，要么是忽略之，要么是什么真的非常奇特的花样去处理它。

3.3 网络和 loss 函数

在这里插入图片描述
detail的咱们不看，就看看每个项目是什么意思吧：
lr 是一个光流的重建损失；
lg 是 morph 的loss
lp 是个立体代理 loss

然后，咱们再看看每个是怎么写的：

在这里插入图片描述

另外还说了一个 fine tuning 的 loss ：

在这里插入图片描述

第四节：实现的细节

看人家的代码：

http://cvlab.cse.msu.edu/project-edgedepth.html

非正经研究生

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
读论文 The Edge of Depth Explicit Constraints between Segmentation and Depth

The Edge of Depth: Explicit Constraints between Segmentation and Depth一句话总结明摆着用语义来约束深度估计相关工作10，12 自监督；需要事先知道两个相机的位置，把深度估计问题转化为差异图估计。10: Unsupervised cnn for single view depth estimation:Geometry to the rescue. In Proceedings of the EuropeanConf
复制链接

扫一扫