《哈尔滨工业大学计算机科学与技术学院》由会员分享,可在线阅读,更多相关《哈尔滨工业大学计算机科学与技术学院(30页珍藏版)》请在人人文库网上搜索。
1、哈尔滨工业大学计算机科学与技术学院,1,并行处理与体系结构,哈尔滨工业大学计算机科学与技术学院,2,第3章 性能指标和基准程序,1 系统和应用的基准程序 2 性能和成本 3 基本性能指标 4 并行计算机性能 5 并行程序性能 6 可扩展性和加速比分析,哈尔滨工业大学计算机科学与技术学院,3,6 可扩展性和加速比分析,本节将讨论: 基于3种加速比指标; 引入3种性能模型。,哈尔滨工业大学计算机科学与技术学院,4,描述说明: n是并行系统中处理器数; W是问题规模(计算负载、工作负载,它定义为给定问题的总计算量); Ws,Wp ,Ws=W1 ; -串行分量比例,=Ws/W;1-为并行分量比例; T。
2、s=T1为串行执行时间,Tp为并行执行时间; S为加速(比);E为效率。,哈尔滨工业大学计算机科学与技术学院,5,一、 Amdahl定律: 特点:固定问题规模,原因多种 描述:,哈尔滨工业大学计算机科学与技术学院,6,哈尔滨工业大学计算机科学与技术学院,7,哈尔滨工业大学计算机科学与技术学院,8,哈尔滨工业大学计算机科学与技术学院,9,哈尔滨工业大学计算机科学与技术学院,10,实际上,并行加速不仅受限于程序的串行分量,而且也受并行程序运行时的额外开销影响。 令T0为额外开销(与n相关)。,哈尔滨工业大学计算机科学与技术学院,11,例:并行APT执行的加速比上限 考察并行APT程序的图。在以下的。
3、条件下估计Amdahl加速比上限:(1)不计所有开销; (2)考虑所有开销,并假设T0()=T0(256) 解: (1)当忽略所有开销时, 工作负载等于 W=1437s 顺序成分是HT步, 说明: =0.041437=0278。 根据Amdahl定律,加速比的上限为: 1=359。,哈尔滨工业大学计算机科学与技术学院,12,哈尔滨工业大学计算机科学与技术学院,13,(2)由方程式可知: T0(256)=00479s。故平均开销为: T0W=004791437=000333 根据方程式,该加速比有一个较严格的上限值: 1(000278+000333)=163,哈尔滨工业大学计算机科学与技术学院,。
4、14,二、Gustafson定律:固定时间 John Gustafson(1988年)提出了固定时间的概念。 对于很多大型应用计算,精度是关键,而计算时间是固定不变的。 为了提高精度,必须加大计算量,增多处理器数,才能维持时间不变;,哈尔滨工业大学计算机科学与技术学院,15,在实际应用中,没有必要固定工作负载,而计算程序运行在不同数目的处理器上,增多处理器必须相应地增大问题规模,才有实际意义。,哈尔滨工业大学计算机科学与技术学院,16,哈尔滨工业大学计算机科学与技术学院,17,哈尔滨工业大学计算机科学与技术学院,18,哈尔滨工业大学计算机科学与技术学院,19,哈尔滨工业大学计算机科学与技术学院。
5、,20,当考虑到并行程序运行时的额外开销W0,应修改为:,哈尔滨工业大学计算机科学与技术学院,21,三、Sun和Ni定律:存储受限 Xian-HeSun(孙贤和)和LionelNi于1993年将Amdahl定律和Gustafson定律一般化,提出了存储受限的加速定律。 基本思想:只要存储空间许可,应尽量增大问题规模,以产生更好和更精确的解(此时可能使执行时间略有增加)。,哈尔滨工业大学计算机科学与技术学院,22,给定一个存储受限问题,假定在单节点上使用了全部存储容量M,并在相应于W的时间内求解完毕。 此时工作负载W=W+(1-)W;,哈尔滨工业大学计算机科学与技术学院,23,在n个节点的并行系。
6、统上,能够求解较大规模的问题是因为存储容量可增加nM。 令因子G(n)反应存储容量增加到P倍时工作负载的增加量,扩大后的工作负载: W=W+(1-)G(n)W,哈尔滨工业大学计算机科学与技术学院,24,存储受限的加速公式相应为:,哈尔滨工业大学计算机科学与技术学院,25,哈尔滨工业大学计算机科学与技术学院,26,哈尔滨工业大学计算机科学与技术学院,27,当考虑到并行程序运行时的额外开销T0,应修改为:,哈尔滨工业大学计算机科学与技术学院,28,G(n)=1时,它变为Amdahl加速定律: 当G(n)=n时,它变为Gustafson加速定律: S”=+n(1-),哈尔滨工业大学计算机科学与技术学院,29,当G(n)n时,它相应于计算机负载比存储要求增加得快; 此时Sun和Ni加速均比Amdahl加速和Gustafson加速为高。,哈尔滨工业大学计算机科学与技术学院,30,本章总结: 重点讨论了计算机系统的性能评价问题: 系统和应用的基准程序、 性能和成本、基本性能指标、并行计算机性能、并行程序性能和可扩展性和加速比分析。