并行计算
ZDF19
这个作者很懒,什么都没留下…
展开
-
并行硬件和并行软件
From:《并行程序设计导论》2.1.1 Von Neumann 结构。 经典的Von Neumann结构包括主存,CPU,以及主存与CPU之间的互连结构。 Von Neumann瓶颈:主存与CPU之间的分离(互连结构)。 瓶颈的原因:互连结构的分离限制了指令和数据访问的速度。2.1.2 进程、多任务以及线程 操作系统(Operating System )是一种原创 2016-12-16 14:14:10 · 1736 阅读 · 0 评论 -
缓存一致性
Cache 一致性问题:在多核系统中,各个核的cache存储相同变量的副本,当一个处理器更新cache中该变量的副本时,其他处理器应该知道该变量已更新,即其他处理器中cache的副本也应该更新。 有两种主要的方法来保证cache的一致性:监听cache一致性( Snooping Cache Coherence )和基于目录的擦车一致性(Directory Based Cache Cohere原创 2016-12-18 20:55:49 · 2673 阅读 · 0 评论 -
组通信与点对点通信
通信子(communicator):是指一组可以相互发送消息的进程集合。 集合通信(collective communication):也叫组通信,是指设计通信子中所有进程的通信函数。 点对点通信(point-to-point communication):函数对(两个函数)之间的通信。 集合通信和点对点通信的区别: 1)通信子中的所有进程都必须调用相同的集合通信函原创 2016-12-19 08:29:48 · 2669 阅读 · 1 评论 -
数据结构——左高树
12.5左高树(高度优先左高树,height-biased leftist tree, HBLT)12.5.1高度优先与宽度优先的最大及最小左高树 考虑一棵二叉树,它有一类特殊的节点交外部节点(external node),它代替树中的空子树。其余节点叫做内部节点(internal node),内部节点是包括叶子节点的。增加了外部节点的二叉树叫做扩充二叉树(extended binary原创 2016-12-26 08:49:20 · 2259 阅读 · 0 评论 -
OpenMP——共享编程知识点
OpenMP是一个库,是针对共享内存并行编程的API。 OpenMP被明确地设计成可以用来对已有的穿行程序进行增量式并行化,这对于MPI是不可能的,对于Pthreads也是相当困难的。 这里的OpenMP学习这几部分:1)对源代码进行少量改动就可以并行化许多串行的for循环。2)任务并行化。3)显式线程同步。4)缓存对共享内存编程的影响(这是共享内存编程中的标准问题)。5)当串行代码(原创 2016-12-20 22:31:07 · 1819 阅读 · 0 评论