多视图立体几何PatchMatchStereo：DSI与Cost Volume

最新推荐文章于 2023-09-13 20:51:15 发布

Tom Hardy

最新推荐文章于 2023-09-13 20:51:15 发布

阅读量420

点赞数 2

文章标签：计算机视觉人工智能深度学习 opencv etag

本文链接：https://blog.csdn.net/qq_29462849/article/details/118160312

版权

本文深入探讨了PatchMatch Stereo算法中的几何关系，解释了DSI(Disparity Space Image)和Cost Volume的概念。Cost Volume在深度学习的立体匹配中常见，而DSI是立体视觉和多视图几何的重要辅助图像。两者都是在视差空间中表示匹配代价的方式，有助于理解深度估计的过程。

摘要由CSDN通过智能技术生成

在上一篇文章：传统多视图立体算法：PatchMatchStereo详解^[1]中，我们谈到利用在视差空间对每一个像素随机一个视差平面，然后通过传播这个视差平面参数，使得每一个像素经过周围像素影响以得到更佳的视差平面。这其中涉及到的几何推理文中并没有详细说明，使读者对公式产生疑惑，因此，本文将首先对文中的几何公式进行推导，其次，该篇文章在视差平面采样的时候提到DSI(Disparity Space Image)的概念，这表示引入一个视差空间，并在这个空间中进行采样。虽然本文对DSI没有过多的阐述和使用，但DSI在立体视觉中是一个重要的概念，而同时在立体稠密匹配和多视匹配中，无论是传统方法还是深度学习方法，许多的文章或工作都提及了Cost Volume概念，又与DSI有何联系呢？本篇文章将一一揭晓。

1、再谈PatchMatch Stereo中的几何关系

回顾一下，PatchMatch Stereo中的视差计算公式(式1)，

图1 视差空间示意图

① 图像坐标系左手系或者右手系都可以定义，不过一般是右手系

2、Cost Volume和DSI

2.1、Cost Volume

Cost Volume，暂且翻译作代价卷、代价体。在基于深度学习的立体匹配、多视图几何中经常提及，比如香港科技大学的2018年提出的经典框架MVSNet^[3]，利用三维卷积神经网络对多视图匹配代价体进行正则化，并利用softmax方法得到每个像素在不同的深度的概率，阿里巴巴在2020年提出了改进网络Cascade-Cost Volume^[4]，利用一种接链式代价体构造方法提升深度估计的分辨率和精度。那我们