参考代码:DenseDepth
论文名称:High Quality Monocular Depth Estimation via Transfer Learning
1. 概述
导读:这篇文章是使用深度监督的方式进行训练的,文章使用在ImageNet上训练过的DenseNet-169作为编码器,之后使用shortcut链接和上采样模块(上采样操作+2个卷积层)作为解码器,从而构建一个U型的网络结构。在此基础上使用输入的深度GT作为回归目标,从而实现网络的训练。
在下图中可以将文章的方法与DRON方法(分段回归)进行比较,文章的方法更加自然和实际。
2. 方法设计
2.1 网络结构
文章的网络结构比较简单,是一个带shortcut链接的U型网络结构:
编码器是DenseNet-169(pretrained on ImageNet),解码器由上采样模块(2x上采样+2个不带BN的卷积)构成,之后在解码器的最后一个上采样模块上预测对应的深度图。
2.2 损失函数
预测得到的深度图表示为 y ^ \hat{y} y^,对应的标注GT表示为 y y y,那么预测与回归之间的监督关系被描述为:
L ( y , y ^ ) = λ L d e p t h ( y , y ^ ) + L g r a d ( y , y ^ ) + L S S I M ( ( y , y ^ ) ) L(y,\hat{y})=\lambda L_{depth}(y,\hat{y})+L_{grad}(y,\hat{y})+L_{SSIM}((y,\hat{y})) L(y,y^)=λLdepth(y,y^)+Lgrad(y