基于mpi的奇偶排序_MPI并行编程系列三：并行正则采样排序PSRS

最新推荐文章于 2021-07-31 12:05:27 发布

weixin_39875031

最新推荐文章于 2021-07-31 12:05:27 发布

阅读量434

点赞数

文章标签：基于mpi的奇偶排序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39875031/article/details/111547816

版权

快速排序算法的效率相对较高，并行算法在理想的情况下时间复杂度可达到o(n)，但并行快速排序算法有一个严重的问题：会造成严重的负载不平衡，最差情况下算法的复杂度可达o(n^2)。本篇我们介绍一种基于均匀划分的负载平衡的并行排序算法------并行正则采样排序(Parallel Sorting by Regular Sampling)。

一、算法的基本思想

假设待排序的元素n个，处理器p个。

首先将这n个元素均匀的分成p部分，每部分包含n/p个元素。每个处理器负责其中的一部分，并对其进行局部排序。为确定局部有序序列在整个序列中的位置，每个处理器从各自的局部有序序列中选取几个代表元素，将这些代表元素进行排序后选出p-1个主元。每个处理器根据这p-1个主元将自己的局部有序序列分成p段。然后通过全局交换的方式，将p段有序序列分发给对应的处理器，使第i个处理器都拥有各个处理器的第i段，共p段有序序列。每个处理器对着p段有序序列进行排序。最后，将各个处理器的有序段依次汇合起来，就是全局有序序列了。

二、算法描述

根据算法的基本思想，我们对算法的描述如下：

输入：n个待排序的序列

输出：分布在各个处理器上，得到全局有序的数据序列

1)无序序列的划分及局部排序

根据数据快的划分方法(请看系列一)，将无序序列划分成p部分，每个处理器对其中的一部分进行串行快速排序，这样每个处理器就会拥有一个局部有序序列。

2)选取代表元素

每个处理器从局部有序序列中选取第w,2w,...,(p-1)w共p-1个代表元素。其中w = n/p^2。

3)确定主元

每个处理器都将自己选取好的代表元素发送给处理器p0。p0对这p段有序序列做多路归并排序，再从这排序后的序列中选取第p-1,2(p-1), ...,(p-1)(p-1)共p-1个元素作为主元。

4)分发主元

p0将这p-1个主元分发给各个处理器。

5)局部有序序列划分

每个处理器在接收到主元后，根据主元将自己的局部有序序列划分成p段。

6)p段有序序列的分发

每个处理器将自己的第i段发送给第i个处理器，是处理器i都拥有所有处理器的第i段。

7)多路排序

每个处理器将上一步得到的p段有序序列做多路归并。

经过这7步后，一次将每个处理器的数据取出，这些数据是有序的。

三、算法分析

1)负载均衡分析：

因为这个算法是一个负载平衡的算法，者从第1)步中就可以看出来，但却不是完美的，因为在第6)步的划分很可能会引起负载的不平衡。

2)时间复杂度分析

PSRS算法适合处理大批量的数据(呵呵，数据量不大，何必并行乎)。当n>p^3时，算法的时间复杂度可达n/p*logn。具体每一步的时间复杂度的分析在这里就不一一描述了，因为每一步的排序都是普通的串行排序算法。

四、算法实现

因为算法比较复杂，代码较长，本文仅仅列出主代码&#

最低0.47元/天解锁文章

weixin_39875031

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
基于mpi的奇偶排序_MPI并行编程系列三：并行正则采样排序PSRS

快速排序算法的效率相对较高，并行算法在理想的情况下时间复杂度可达到o(n)，但并行快速排序算法有一个严重的问题：会造成严重的负载不平衡，最差情况下算法的复杂度可达o(n^2)。本篇我们介绍一种基于均匀划分的负载平衡的并行排序算法------并行正则采样排序(Parallel Sorting by Regular Sampling)。一、算法的基本思想假设待排序的元素n个，处理器p个。首先将这n个元...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。