最近在学习OpenCL的使用以及一些并行算法。于是想记录一下自己的一点收获,供自己以后参考吧。关于OpenCL的介绍,网上一搜一大堆,在这里我就不赘述了。简要地说,它就是一个针对异构平台编程的行业标准,或者说是一套API,由一个名为Khronos的小组进行制定和维护。几大CPU、GPU制造商都支持OpenCL。简单地说,OpenCL代码可以在大部分的GPU、CPU上实现。使用OpenCL最大的好处在于能够综合CPU和GPU的逻辑判断与并行计算的能力。GPU与生俱来的强大的并行计算能力令人震撼,但是在并行计算背后离不开并行算法。今天我来讲述一下双调排序,一种在并行计算平台上使用广泛的排序算法。 关于双调排序的概念、用到的定理以及其证明过程这里就不展开叙述了。各位看官可以先参考以下链接中的博客,了解双调排序的基本概念。个人感觉这篇博客写得挺通俗易懂的。双调排序网络看上去貌似十分复杂,时间复杂度也是个略显诡异的数值(O(nlog n * log n)),但是其实里面的东西并不多。读者若是第一次学习双调排序,只需要从下面博客中了解到什么是双调序列、什么是半清洁器就可以了。
这里首先盗用一下这篇博客中的最后一张图为接下来的算法实现提供参考: