深度估计

最新推荐文章于 2024-06-12 12:44:13 发布

qq_26697045

最新推荐文章于 2024-06-12 12:44:13 发布

阅读量2.1k

点赞数

分类专栏：深度学习基础s

本文链接：https://blog.csdn.net/qq_26697045/article/details/89052843

版权

64 篇文章 0 订阅

订阅专栏

一.迁移学习[论文][Keras][监督]

1).网络：

2).损失函数：

每个像素的预测深度与实际深度的L1损失： $L_{depth}\left ( y, \hat{y} \right ) = \frac{1}{n} \sum_{p}^{n} \left | y_{p} - \hat{y}_{p} \right |$ 。由于该损失会随深度值的变大而变大，作者使用原始深度值 $y_{orig}$ 的导数 $y=m/y_{orig}$ 作为深度值， $m$ 是最大深度值。
图像梯度与深度图梯度的L1损失： $L_{grad}\left ( y,\hat{y} \right )=\frac{1}{n}\sum_{p}^{n}\left |g_{x}\left ( y_{p},\hat{y}_{p} \right ) \right | + \left |g_{y}\left ( y_{p},\hat{y}_{p} \right ) \right |$ 。
图像与深度图的SSIM。

二.对偶网络[论文][TF][无监督]

无监督的深度估计一般利用基于对极几何的图像重建损失训练CNNs产生视差图。

1).网络框架：

对偶网络来自Godard，分别输出左右视差图。使用空间变换网络提出的双线性采样方法用视差图重建图像：用左视差图和右图像重建左图像；用右视差图和左图像重建右图像。

2).训练，6项损失(3组)：

网络会输出4个尺度的视差图，对每个尺度都计算这样的损失。这些损失的定义也都来自Godard。

三.序数回归[论文][Caffe][监督][Robust Vision Challange 2018第一名]

1).主要工作：序数回归和多尺度特征。

2).序数回归：

把深度估计建模成回归问题然后用最小化均方误差训练网络。这种方法收敛慢且局部效果不好。
作者把连续的深度估计离散化，实验证明增距离散(spacing-increasing discretization, SID)优于等距离散(uniform discretization, UD)。
网络监督信息是SID策略输出的离散深度值。

3).多尺度特征：

关注