高等计算机系统结构 清华大学,高等计算机系统结构清华大学计算机系.ppt

计算机科学与技术系研究生课程

高等计算机系统结构

清华大学计算机科学与技术系高性能计算研究所

郑纬民教授

2007年9月

高等计算机系统结构

第一章高等计算机的核心技术——并行处理

第二章加速比性能模型与可扩展性分析

第三章互连与通信

第四章划分与调度

第五章并行存储器系统

第六章 Cache Coherence

第七章 Memory Consistency

第八章指令级并行处理

第九章微处理器设计与实现方法

第十章网格计算

高等计算机系统结构

第十

DSM

第十二章传感器网络

第十三章对等计算

第十四章海量网络存储器

第十五章多核CPU技术

第十六章可信计算系统

第十七章虚拟化技术

第十八章基于集群的海量数据处理

第二章加速比性能模型与可扩展性分析

2.1加速比性能分析

2.1.1一般概念

2.1.2加速比

1.3三种加速比性能模型

22可扩展性分析

2.1加速比性能模型

2.1.1一般概念

1处理机一时间积

处理机数目与处理时间的乘积用以度量

这些处理机运行时的资源利用率

若一程序在

Tp,则此P台处理机在Tp时间间隔内完成的工

作最大数量为Ip*P。

可将处理机实际工作曲线对时间的积分

看成是这些处理机完成的有效工作量。

效率为有效工作量与最大工作量之比。

2.并行度( Degree Of Parallelism--DOP)

并行度(DOP)是在一定时间间隔内执行

个程序所用的处理机的数目。

3.并行性分布图

执行一个给定的程序时DOP对时间的分布

DOP与对应时间的间隔之积即为处理机要

完成的工作或工作负载

下图所示为一个并行性分布图。

DOP

tI

并行性分布图

2.1.2加速比

1.绝对加速比

将最好的串行算法与并行算法相比较.

定义一(与具体机器有关)将最好的串行算

法在一台上的运行时间与并行算法在N台运行

的时间相比

定义二(与具体机器无关)将最好的串行算

法在最快的顺序机上的执行时间与并行算法

在并行机上的运行时间相比。

2相对加速比

同一并行算法在单节点上运行时间

与在多个相同节点构成的处理机系统上的

运行时间之比。

这种定义侧重于描述算法和并行计

算机本身的可扩展性。

线性加速比:中间开销小,通信少,弱耦合计算

超线性加速比:当应用需要大内存时可能出现

病态加速比:加速比递减,可能是计算量太小

2.1.3三种加速比性能模型

1.固定负载加速比性能模型— Adah定律

在许多实时应用领域,计算负载的大小常固

定。在并行机中,此负载可分布至多台并行执行,

获得的加速比称为fxed- oad speedup。一个问题的

负载可表示如下

W=WS+ Wp

其中,Ws代表问题中不可并行化的串行部分负载,

Wp表示可并行化的部分负载。

则n个节点情况下,加速比可以表示如下

Ws+wp

Ws+wp/n

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值