在上一篇文章:传统多视图立体算法:PatchMatchStereo详解[1]中,我们谈到利用在视差空间对每一个像素随机一个视差平面,然后通过传播这个视差平面参数,使得每一个像素经过周围像素影响以得到更佳的视差平面。这其中涉及到的几何推理文中并没有详细说明,使读者对公式产生疑惑,因此,本文将首先对文中的几何公式进行推导,其次,该篇文章在视差平面采样的时候提到DSI(Disparity Space Image)的概念,这表示引入一个视差空间,并在这个空间中进行采样。虽然本文对DSI没有过多的阐述和使用,但DSI在立体视觉中是一个重要的概念,而同时在立体稠密匹配和多视匹配中,无论是传统方法还是深度学习方法,许多的文章或工作都提及了Cost Volume概念,又与DSI有何联系呢?本篇文章将一一揭晓。
1、再谈PatchMatch Stereo中的几何关系
回顾一下,PatchMatch Stereo中的视差计算公式(式1),
图1 视差空间示意图
① 图像坐标系左手系或者右手系都可以定义,不过一般是右手系
2、Cost Volume和DSI
2.1、Cost Volume
Cost Volume,暂且翻译作代价卷、代价体。在基于深度学习的立体匹配、多视图几何中经常提及,比如香港科技大学的2018年提出的经典框架MVSNet[3],利用三维卷积神经网络对多视图匹配代价体进行正则化,并利用softmax方法得到每个像素在不同的深度的概率,阿里巴巴在2020年提出了改进网络Cascade-Cost Volume[4],利用一种接链式代价体构造方法提升深度估计的分辨率和精度。那我们