有序数组合并的并行算法（有一定限制）

最新推荐文章于 2024-08-31 00:59:21 发布

realxie

最新推荐文章于 2024-08-31 00:59:21 发布

阅读量2.9k

点赞数

分类专栏：分布式与并行计算算法文章标签：算法 parallel c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/realxie/article/details/7216852

版权

算法同时被 2 个专栏收录

44 篇文章 0 订阅

订阅专栏

分布式与并行计算

9 篇文章 1 订阅

订阅专栏

如果A=(a1,a2,...,am)和B=(b1,b2,...,bn)是两个有序的升序数组，合并数组A和B就行形成一个新的升序数组包含A和B的有所有元素，假设A=(2,4,11,12,14,35,95,99)，B=(6,7,9,25,26,31,42,85,87,102,105).

如果合并A和B的数组，串行算法会遍历两个数组，然后将数组元素存到数组C中，开始时设置两个指针，分别指向数组A和B的每一个元素，接下来每个移动A或者B的一个指针。如此遍历时间复杂度为O(m+n)。其伪代码如下

串行算法：

输入A和B

输出C

1. set a[m+1] = +INF,b[n+1] = +INF.

2. set i = 1, j = 1 , k = 1

3. while k <= m+n do

4. If a[i] < b[j] do

c[k] = a[i] and i = i+1

else

c[k] = b[j] and j = j + 1;

endif

5. k = k + 1;

6. End While

7. END

下面分析其并行算法（注意本算法有一个局限性，只适用于最终合并的C中没有重复元素的情况）

定义： rank(x:A)指数组A中不大于x的元素个数, rank(6:A)=2, rank(25:A)=5.

rank(B:A)为数组(r1,r2,..., rn),其中ri=rank(B[i]:A)

对于上面给出的A和B数组，可以得到如下。

rank(B:A)=(2,2,2,5,5,5,6,6,6,8,8)

rank(B:B)=(1,2,3,4,5,6,7,8,9,10,11)

rank(A:B)=(0,0,3,3,3,6,9,9)

rank(A:A)=(1,2,3,4,5,6,7,8)

进一步分析rank(x:A U B)是指AUB中不大于x的元素数量，因此rank(x:AUB=rank(X:A)+rank(x:B),进一步：

rank(A:AUB)= rank(A:A)+rank(A:B) = (0,0,3,3,3,6,9,9) + (1,2,3,4,5,6,7,8)

= (1,2,6,7,8,12,16,17)

rank(B:AUB)= (3,4,5,9,10,11,13,14,15,18,19)

从rank(A:AUB)中我们可以知道A中每个元素中C中的位置，即C[1] = 2, C[2] = 4, C[6] = 11, C[17] = 99. 对B中元素可以rank(B:AUB)确定其中C中的位置

上面介绍了基本的算法思想，下面来分析该算法，并将其并行化。
下面给出该算法的伪代码

1. For i = {1, 2, .. , m} and j = {1 , 2 , ..., n} do in parallel

2. find rank (ai:A) and find rank(bj:B)

3. find rank (ai:B) and find rank(bj:A)

4. END parallel

5. Denote rank(A:B)and rank(B:A).

6. RA = rank(A:A)+rank(A:B)

7. RB = rank(B:A)+rank(B:B)

8. for i = 1 to m do in parallel

9. C[RAi] = A[i]

10. End Parallel

11. for i = 1 to n do in parallel

12. C[RBi] = B[i]

13. End Parallel

14. END

时间复杂度分析：

由于A和B是有序的，我们可以使用二分搜索法利用一个处理器在O(log(m))的时间内完成求rank(x:A)，相似地rank(x:B)的复杂度为O(log(n)).

因此1~4步使用m+n个处理器可以在O(log(n))（假定n >= m)的时间内完成，其余步骤都可以在O(1)的时间内完成，因此该算法的时间复杂度为O(Log(n)), 需要使用的处理器个数为m+n.

本算法中最重要的部分是求rank(A:AUB)和rank(B:AUB)，假设使用m+n个处理器，可以在O(log(n))完成。下面给出该算法的伪代码

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

realxie CSDN认证博客专家 CSDN认证企业博客

码龄13年

80: 原创

13万+: 周排名

42万+: 总排名

77万+: 访问

: 等级

7777: 积分

137: 粉丝

109: 获赞

71: 评论

125: 收藏

私信

关注

热门文章

分类专栏

google 2篇
linux 13篇
cpp 41篇
算法 44篇
win7 1篇
分布式与并行计算 9篇
感悟 3篇
逻辑 5篇
资讯 2篇
存储 3篇
架构 7篇
python 1篇
语言 3篇
数学 5篇
tx
操作系统 1篇
计算机国学
计算机图形学 1篇
交互设计 1篇
游戏开发 7篇
Lua 1篇
游戏引擎 4篇
设计模式 1篇
pujf
实时渲染 10篇

最新评论

C++核心指南-中文版本-（翻译持续更新中）
CSDN-Ada助手: 非常感谢CSDN博主的分享，C++核心指南是非常重要的技术指南，中文版本也非常受欢迎。我觉得下一篇博客可以围绕C++编程实践进行讲解，介绍一些有用的技巧和实践方法，如何规范化代码等等。这样的技术文章对其他用户也会非常有帮助，希望CSDN博主可以继续分享更多经验和心得，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
矩阵乘法的并行算法
泰勒展不开~: 您好，请问最后提到的伪共享问题是什么意思呢？是因为cache line在不同核之间转移吗？
C++中单引号“字符串”的用法
hahajiajun: “X86采用的是小端模式，即将整形的高位放在了内存的低地址处. ”这句话是不是有点问题？小端模式下，整形的高位应该放在内存的高位吧
MESI－CPU缓存一致性协议
su371128017: 综合大家的观点，缓存一致性MESI协议保证的是各个cpu拿到的缓存是一致的。但缓存一致性并不能保证我们的代码是线程安全（不能保证我们的代码是原子性的）。这是因为cpu的“写缓存”和“失效队列”造成的，cpu2收到变量失效的消息后，它可能因为忙碌或则因为时间周期到了并没有时间去处理，只是记录到“失效队列”中，同时cpu2的寄存器中已经在进行a+1的操作了。之后cpu2回写缓存中，最终也去覆盖内存中的a值，而此时cpu2可能才有空去将失效队列中的数据进行处理。因为要最大程度充分利用性能，当代CPU没有完全按照缓存一致性协议顺序执行所有的指令，很多地方都改成了异步。这里关于为什么变量a已经在失效队列中，还能被写回到内存中，为什么cpu不先判断失效队列再做下一步操作？这种cpu硬件上的问题，也是我同样好奇，不知道有没有cpu方面的大佬，可以说道说道。
linux下c++多线程下统计程序运行时间(非常注意)
weixin_43762147 回复 gary1982_chu: 我也想问问

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。