两个网络本质上相同,实际上他们同年提出。论文中所示最大的区别在于得到残差深度的方式
CasMVSNet:
需要注意的是,图并没有完全画完。除第一阶段生成一个粗深度图,每一阶段生成的应该是残差深度图,与上一层深度图的上采样叠加后,产生新的深度图,这个图在 CVP-MVSNet显示的更贴切。
本网络的获取残差深度图的方式为通过缩小剩余深度获取,这个范围是通过一个系数实现的
测试数据集
1152×864。
CVP-MVSNet:
此图能更清晰的说明每一阶段的产生结果
本网络获取残差深度的范围是通过两个像素的重投影决定
对于某个像素的深度剩余,首先把它投影到src上,在src的极线上找相邻的2个像素,沿着src相机通过这两个点到3D空间,就得到了深度剩余refine时候的范围。
深度假设平面没必要太过密集,投影过来的3D点太近,无法为深度推断提供额外信息
实验中,计算图像中距离0.5像素的点的平均深度间隔
测试数据集
对于1600×1184的输入大小,金字塔有5个级别,对于800×576和640×480的输入大小,金字塔有4个级别。