从串行算法到并行算法

最新推荐文章于 2024-07-28 13:06:23 发布

天亮又要起床Fiiii

最新推荐文章于 2024-07-28 13:06:23 发布

阅读量1.5k

点赞数 2

分类专栏：分布式计算系统复习文章标签：数据结构分布式并行计算

本文链接：https://blog.csdn.net/fiyaz/article/details/118120635

版权

4 篇文章 1 订阅

订阅专栏

分解类型	设计
任务	计算被分解为一组独立的任务，多个线程可以用任意顺序执行这些任务将不同的行为分配给不同的线程
数据	程序需要处理一个大型数据集，并且可以对数据集中的每个元素进行独立计算令多个线程对不同的数据集执行同样的操作
数据流	一个线程的输出是第二个线程的输入，需要特别关注消除开始和结束的延迟

任务分解：

园丁问题，让每个园丁负责不同的工作，共同经营同一块草地
数据分解：

生命游戏问题，将棋盘划分为多个区域（多个子棋盘），每一区域分配线程独立进行计算，最后再整合得到新棋盘

园丁问题，让每个园丁负责一小块草地
数据流分解：

由第一个任务引起的延迟为第二个任务产生一个暂停，在此之后两个任务才能并行运行。在计算机领域这样的模式经常发生。

生产者消费者模型

核心：串行->并行

技巧：将计算密集的代码分解（计算量大或耗时多的代码）

任务并行的3个元素

在这里插入图片描述

任务的数据至少与执行单元的数目一样多，越多越好，确保调度时有很大灵活性
与各个任务相关联的计算量必须足够多，以此来抵消与任务管理和处理任何依赖性相关的开销（粒度）

在这里插入图片描述

实际上就是数据的并行化

问题涉及对递归的数据结构的操作（如：列表，树，图）

核心：结合数据块的形状与数据的交互方法进行设计

在这里插入图片描述

a：粒度2*8=16，需要交换数据的边界为8，体积/表面积 = 2

b：粒度4*4=16，需要交换数据的边界为4，体积/表面积 = 4

则b比a更优

关注

专栏目录