文章概况
基于SGM算法,针对高分辨率航空影像,提出一种基于CPU平台的系统化高效立体匹配算法优化方法,主要的创新点如下:
- 设计了一种高效的以数据并行模型为基础的并行计算模型
- 对于SGM算法的4个主要步骤进行SSE指令集优化
- 提出一种分层SGM立体匹配模型
优化1:多核并行
优化2:Single Instruction Multiple, SIMD
SIMD结构示意图
SIMD五种使用方法
指令集选择
SSE指令集
指令集运算步骤
基于SSE指令集的SGM匹配算法优化
优化3:分层SGM
视差分层是为了缩小视差搜索空间,从而降低时间复杂度以及内存消耗。
首先,立体匹配在整个视差空间中搜索最优视差曲面,如图所示,给定宽高和视差搜索范围,形成一个三维视差空间,而每个像素的最优视差值会组成一个最优视差曲面。
而如果将视差搜索范围限制在一个较小的范围内,就可以有效提高视差搜索效率,减少内存占用,如图所示。
这就是金字塔匹配策略,在前面的文章《Evaluation of a New Coarse-to-Fine Strategy for Fast Semi-Global Stereo Matching》就有用到这个方法,但SGMf这篇文章只使用了半分辨率的图像,也就是金字塔只有两层。对于超高分辨率图像,如这篇文章中使用的航空图像就需要进行多级分层,如图所示。
除了最顶层(分辨率最低的一层)的视差搜索空间是全范围,其他层的视差搜索范围是按照
确定的。
当进行最后一次Match last之后,得到的视差图就是精确的视差估计。
在分层SGM方法中,会有两个问题:
- Disparity peaks:用广度优先搜索来检测
- Disparity holes:用LR-check检测
对于以上两个问题,都会产生视差空洞。如果不进行填充,那么视差传递到下一层之后,会导致产生大片的视差空洞,所以要进行视差填充之后才能传递到下一层。经试验证明,进行peaks填充之后可以缩小cost cube,提高计算速度和降低内存占用。
总优化路线
Reconstruction from multi-view matching results
如果仅仅用一对立体匹配图像,那么得到的视差值是存在偏差的,导致点云有一些离群点。为了减小离群值的影响,提高鲁棒性,就用多对立体匹配对来进行视差估计,以其中一张图像为参考图像,那么就可以得到多张视差图,所以,同一个像素点就有多个相近的三维坐标(E1, E2… En),根据下式计算偏差:
如果偏差小于一定阈值,那么就认为这个点是可信的点,取平均值作为最终的坐标。
用多视图还有一个好处,就是可以补偿阴影和遮挡,因为在一对匹配图中有遮挡,在另一对匹配图中可能就没有遮挡。
实验结果
借鉴
可以用本文提出的金字塔分层策略来缩小视差搜索范围,提高计算速度和降低内存占用。