深度估计
-
[2019] Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics 链接
-
SGANVO: Unsupervised Deep Visual Odometry and Depth Estimation with Stacked Generative Adversarial Networks 链接
Contribution:使用多个GAN加上一对双目的图像进行训练 -
[2018] Pyramid Stereo Matching Network 链接
Contribution : 主要用到了空洞卷积、金字塔结构来处理双目视频 -
[2019] Neural RGB→D Sensing: Depth and Uncertainty from a Video Camera 链接
Contribution:1.实现了多帧视频的输入,真正意义上实现相邻帧之间几何信息和神经网络的结合,改造costv_olume提出了DPV深度概率模型的方法 2.尝试引入类似卡尔曼滤波的网络结构,但是结果感人,归其原因没有实现真正的深度概率密度分布 -
[2015] Fully Convolutional Residual Network for Depth Estimation 链接
Contribution:简单粗暴使用ResNet-50去训练深度,实际效果感人,速度也感人 -
[2019] Self-supervised Learning for Dense Depth Estimation in Monocular Endoscopy
Download : https://arxiv.org/pdf/1902.07766.pdf
Contribution:将传统的多视角几何融合到神经网络当中,实现了部分监督的效果去训练图像,缺陷:并有真正使用到相邻帧的几何关系,实际更多依赖的是来自SFM的三维点的监督 -
[2019] Unstructured multi-view depth estimation using mask-based multiplane representation 链接
Contribution:使用到了多视角几何的知识,固定参考帧,用多张图进行匹配,同时使用(具有高置信度的)部分特征图的深度概率来进行训练,没有源码,从论文来看效果有待改进 -
[2019] A Survey on Deep Learning Architectures for Image-based Depth Reconstruction
Download:https://arxiv.org/pdf/1906.06113v1.pdf
Contribution:总结了截止2019年初的关于深度估计的多种方法(包括结合多视角几何的算法),里面有关于损失函数的汇总,是比较好的summary -
[2019] Recurrent Neural Network for (Un-)supervised Learning of Monocular Video Visual Odometry and Depth 链接
Contribution:结合LSTM、多视角几何算法,具有多帧信息,并且不依赖相机的姿态(网络自带姿态的估计),但是论文说法比较含糊,关键模块没说清(关于关于多帧输入,论文中只是说先前帧的信息在隐藏层中?),代码没有开源。
SFM
- colmap Github 开源的SFM+MVS一体的开源重构库