常用并行机性能评估指标

文章探讨了并行机的性能评估,从机器、算法和程序三个方面展开,包括处理器数量、时钟速度、工作负载、并行执行时间、加速比和存储器层次结构等关键参数。Amdahl定律和Gustafson定律解释了处理器增加对加速比的影响。同时,文章提到了可扩展性的三种标准:等效率、等速度和平均延迟标准。
摘要由CSDN通过智能技术生成

常用的并行机分别从机器,算法,程序三方面对并行机的性能进行评估。

1. 并行机的基本评测标准(机器级)

并行机基本参数概述
名称符号含义单位
机器规模n处理器的数量无量纲
时钟速度f时钟长度的倒数MHz
工作负载W计算操作的数目MFLOP
顺序执行时间T1程序在单处理机上的运行时间s
并行执行时间Tn程序在并行机上的运行时间s
速度Rn = W/Tn每秒百万次浮点运算MFLOPS
加速Sn=T1/Tn衡量并行机的速度无量纲
效率En = Sn/n衡量处理器的利用率无量纲
峰值速度Rpeak = nR'peak所有处理器的峰值之和MFLOPS
利用率U = Rn/Rpeak可达速度与峰值速度之比无量纲
通信延迟t0传送0字节或单字的时间us
渐进带宽r传送长信息的速率MBps

1.1 工作负载

    所谓工作负载是指计算操作数目,通过执行时间,浮点运算数,指令数目三个物理量进行衡量。

  • 执行时间

        执行时间包括:CPU执行时间,访问内存的时间,IO交互时间等。

  • 浮点运算数

        浮点数运算数目。

  • 指令数

        所执行的指令条数。

1.2 并行执行时间
       Tn = Tcomput + Tparo + Tcomm

       Tn计算时间;Tparo表示并行开销时间(进程管理时间,组操作等);Tcomm表示互相通信时间(同步时间,聚合时间)。
1.3 存储器的层次架构

  • 容量C

         表示实际的物理存储器件能保存多少字节;

  • 延迟L

         表示读取各层物理器件中一个字所需要的时间。

  • 带宽B

        内存的带宽是指数据从内存到处理器的速度,是由存储器主线和存储器部件决定。假设字长为128bit(16B),如果并行机内核有两个load Unit,一个Store Unit,且在1拍内完成128bit的加法,且时钟周期为1GHz,则带宽为3*16*1*10^9 = 48GBps.


2.加速比性能定律(算法级)


2.1.Amdahl 定律
   固定工作总量不变,在固定问题规模的前提,增加处理器的数量对加速比的影响.
2.2 Gustafson定律
   固定时间不变,增加处理器的同时相应的增加问题规模对加速比的影响。
2.3 sun和ni定律
   内存绝对允许,增加问题规模对加速比的影响。
2.4 可扩展性评测标准

    扩展性是计算机系统随处理器数目的增加而增强的能力,比如我在小规模处理器下完成并行计算的性能测试,移植到大规模处理器下,是否能够按比例提升。
   1.等效率标准

      增加处理器p的规模,问题规模随之变换,但保证效率不变,称为等效率标准。

   2.等速度标准

       保持速度不变,随着处理器p数量的增加,相应的扩大问题规模,保证速度不变。

   3.平均延迟标准

        平均延迟是在效率E不变,用平均延迟的比值来衡量随p的增加,相应增加多少工作量。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值