[并行与分布式程序设计] Flynn分类法和并行算法的评价指标

最新推荐文章于 2023-04-10 17:15:41 发布

三三三三三三外

最新推荐文章于 2023-04-10 17:15:41 发布

阅读量675

点赞数

分类专栏：并行与分布式程序设计文章标签：并行计算 simd mimd

本文链接：https://blog.csdn.net/weixin_40996518/article/details/105505842

版权

Flynn’s taxonomy

根据指令和数据能否同时执行, 将计算机系统分为四类:

在个条数据流上执行同一个指令, 数据层面的并行.
将多个数据流分配给多个运算单元, 所有运算单元同时处理每一步, 执行相同的命令(被同一个控制单元控制)
- 没有被分配任务的运算单元空闲等待
- 提前执行完的元算单元也需要等待
- 运算单元没有指令的存储功能, 一次只能执行当时被分配的一个指令
SIMD系统的一个典型应用是向量计算, 向量中的所有数同时进行相同的算术运算
支持向量计算的处理器叫做向量处理器, 与传统只支持标量计算的处理不同, 向量处理器有以下特点:
- 向量寄存器: 能够存储有多个操作数组成的向量
- 向量化的功能单元: 同一个操作可以被应用到向量的每一个元素上
- 向量化的指令: 用来计算向量的运算方法

包含多个完整独立的处理单元, 每个处理单元都有自己的控制单元和运算单元, 可以针对分配到的数据执行不同的任务
与SIMD的所有运算单元统一执行不同, MIMD的所有处理器没有统一的时钟, 每个处理器可以按照自己的节奏执行, 互不影响.
根据处理器和内存之间的访问关系, MIMD分为两类
- 共享内存系统
  - 所有处理器通过一个互联网络和内存系统相连
  - 每个处理器可以访问每一块内存
  - 处理器之间不是直接通信, 而是通过共享数据进行隐式通信
  - 通常包含一个或多个多核处理器
  - 共享内存系统分为两类
    - 一致存访问系统: 一般意义上的共享内存系统
    - 非一致内存访问系统: 每个多核处理器单独与一块内存相连, 访问其余内存块时, 需要通过其余多核处理器, 访问速度较慢.
- 分布式内存系统
  - 最常见的类型就是集群: 多个服务器互相连接形成
  - 严格意义上来讲集群是一个混合系统, 每一个节点是一个共享内存系统, 多个节点相互连接形成分布式内存系统
SPMD (SIngle Program Multiple Data): SIMD中的一种分类
- 多线程控制, 但是每个处理器上拥有的都是相同的程序指令.
- 只有一份可执行代码, 通过条件转移等语句, 让该代码表现得好像在不同处理器上执行不同程序(实际上不同程序执行的都是同一个程序).

用来衡量使用并行方式解决问题所带来的性能提升. 加速比越大, 说明性能提升越多.
假设使用单个处理单元解决问题的时间是Ts(也就是最快的串行算法时间), 使用p个相同的处理单元解决这个问题的时间是Tp(并行算法的时间), 那么加速比S= $\frac{Ts}{Tp}$
- S=p : 线性加速比, 执行速度随着处理器数量的提升而加快, 也是理想加速比.
- S<p: 现实中常见的加速比
- S>p: 超线性加速比 (现实中存在)
如果一个问题的解决有多个不同的串行算法, Ts指的是其中最快的那一个. 比如串行冒泡排序150s, 快排30s, 并行冒泡40s, 加速比S=30/40.

除非一个串行程序的执行几乎全部都并行化, 否则不论多少可利用的核, 通过并行化产生的加速比都会是受限的.

关注