【双目视觉】立体匹配算法原理之“代价空间与聚合、视差计算”

落叶随峰

已于 2022-12-30 21:27:10 修改

阅读量2k

点赞数 3

分类专栏：双目立体视觉文章标签：算法计算机视觉图像处理 python slam

于 2022-08-10 10:04:06 首次发布

本文链接：https://blog.csdn.net/henghuizan2771/article/details/126260760

版权

双目立体视觉专栏收录该内容

5 篇文章 12 订阅

订阅专栏

文章目录

预备知识

代价空间

$C_{A D}(x, y, d)=\left|I_{L}(x, y)-I_{R}(x-d, y)\right|$
bandicam-2022-08-09-17-18-53-853

d是移动像素的大小。以左图为基准。下面以左图的一个像素点P为例

d=0，右图不移动，计算 $C_{AD0}$
d=1，右图向右移动一个像素点，再计算 $C_{AD1}$
d=2，右图向右移动一个像素点，再计算 $C_{AD2}$
…(d++，不断执行)…
最后得到代价空间

代价聚合

🔥目的：对代价空间进行滤波，使边界平滑

Box Filtering（均值滤波）

$C_{d}^{A}(p)=\frac{1}{N} \sum_{q} C_{d}(q)$

N：窗口像素个数

效果：

Bilateral filter

Bilateral filter就是输入的代价，乘以一个高斯函数，实现平滑

效果：

Cross-based local stereo matching(自适应形状)

任意选取一个像素点，横向、纵向扩张，直到遇到颜色差异较大的地方才停下来。然后在扩张后的像素点，重复上述操作。这样，因为能及时发现边界，就能大概判断出一整块区域的视差图

🚀Semi-Global Matching

能量函数
$\begin{aligned} E(D)=& \sum_{\mathbf{p}}\left(C\left(\mathbf{p}, D_{\mathbf{p}}\right)+\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{1} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|=1\right]\right. &\left.+\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{2} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|>1\right]\right) \end{aligned}$

当 $D_p-D_q = 1$ 时，我们就取 $\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{1} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|=1\right]$

当 $D_p-D_q > 1$ ，我们就取 $\sum_{\mathbf{q} \in N_{\mathbf{p}}} P_{2} \mathrm{~T}\left[\left|D_{\mathbf{p}}-D_{\mathbf{q}}\right|>1\right]$

优化步骤

计算代价空间；(AD, BT, Census, MI, ….)
代价聚合

方向r上的路径代价
$\begin{aligned} L_{\mathbf{r}}(\mathbf{p}, d)=& C(\mathbf{p}, d)+\min \left(L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, d)\right.\\ & L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, d-1)+P_{1} \\ & L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, d+1)+P_{1} \\ &\left.\min _{i} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, i)+P_{2}\right)-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k) \end{aligned}$
当d=0时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$

当|d|=1时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)+P_1-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$

当|d|=i时， $L_{\mathbf{r}}(\mathbf{p}, d)= C(\mathbf{p}, d)+P_2-\min _{k} L_{\mathbf{r}}(\mathbf{p}-\mathbf{r}, k)$

$L_r(p-r,d)$ 是该像素点左侧，最优代价。即当d=i时，左侧有最优代价，那么就 $C(\mathbf{p}, d)+P_2$

各个方向的总聚合代价
$S(\mathbf{p}, d)=\sum L_{\mathbf{r}}(\mathbf{p}, d)$
例如opencv收录的sgbm算法，就是计算了下面5条路径的代价
WTA

Winner-Take-All,赢家通吃

即我们发现在这条视差方向r上，纵轴（聚合后的代价）最小，那么我们就取出视差值（d=18）
视差后处理