文章概况
这篇文章是基于census的局部立体匹配的文章,主要是为了评估不同硬件平台上的运行帧数。下面是这篇文章算法的workflow,没什么特别的简单说一下。
看workflow已经对整个流程很清晰了,这里指的注意的是有两点:
- Sparse Census Transform
- 弱纹理优化
如果想知道弱纹理优化,那么可以在我的上一篇文章查看《A Census-Based Stereo Vision Algorithm Using Modified Semi-Global Matching and Plane Fitting to …》,那接下来就只讲一下Sparse Census Transform
Sparse Census Transform
顾名思义,Sparse Census Transform就是稀疏的census transform,具体的做法是在census 窗口内只比较与中心点所在行列相差奇数行、奇数列的像素点:
像上边的公式表示的那样,对于一个 16 *16 的census 窗口,如果是普通的census transform,那么就需要256长度的位串来存储,但用sparse census transform的话,只需要64长度的位串存储,缩短了4倍,但保持着普通census的效果。
实验结果
CPU上不同核数的结果对比
两个GPU和一个DSP
SIMD指令优化
GPU
DSP
对于各种平台的实现方法,文章里面有给出参考文献,博主主要想研究CPU多线程和SIMD指令集以及GPU的实现,目前还处于算法研究阶段,后期再进行硬件平台相关的研究。