论文阅读：Self-Supervised Monocular Depth Estimation with Internal Feature Fusion(DIFFNet)

BlueagleAI

已于 2023-03-01 10:28:16 修改

阅读量668

点赞数 1

分类专栏：深度估计文章标签：论文阅读

于 2023-02-28 16:36:39 首次发布

本文链接：https://blog.csdn.net/blueag1e/article/details/129255772

版权

7 篇文章 1 订阅

订阅专栏

中文标题：基于内部特征融合的自监督单目深度估计

在这里插入图片描述

浅层但高分辨率的特征在空间上很精确，相反，深层但低分辨率的特征在空间上并不精确，但是语义信息丰富。
$x^e_r,s$ 代表特征图中第s阶段，第r个子流。第r个子流的分辨率是原分辨率的 $1/2^{r-1}$ 。
使用HRNet编码器，效果明显强于ResNet.
DIFFNet强制来自不同阶段的特征映射包含不同的语义信息，但在解码之前使用连接策略融合来自所有中间阶段的输出。

- HRNet和DiFFNet不同节点间特征可视化图，可知DiFFnet的深层特征更加语义。
- HRNet和DIFFNet

解码器的整体结构和Mono2类似。将DIFF Encoder的每一自流集合的特征当作与编码器的跳接形成U-net。重点是加入了通道注意力机制帮助特征融合。
注意力机制：
![在这里插入图片描述](https://img-blog.csdnimg.cn/c3fcbad0a59e4e80acde82c36e3c51ab.png#pic_center# = 400x)
在消融实验中，加入空间注意力机制效果不佳，顾舍弃。

在这里插入图片描述

[1] Zhou H, Greenwood D, Taylor S. Self-supervised monocular depth estimation with internal feature fusion[J]. arXiv preprint arXiv:2110.09482, 2021.

关注