利用计算机峰值,计算机的峰值速度

在超级计算机测试中,我们会碰到Rmax和Rpeak两个值。

以我国天河二号超级计算机为例,Rmax值为33,862.70tflop/s

,Rpeak值为54,902.40tflop/s

很多朋友可能会不知道它们的详细意思。

rmax和rpeak在英文词汇中,都不存在这个词汇。我们要讲的是它们作为缩写,在linkpack中的意义。

Linpack是最流行的用于测试高性能计算机系统浮点性能的测试软件。通过用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。

而Rmax和Rpeak是linpack软件提供的两个参考值。

她们的单位为:flop/s或者tflop/s,分别对应:每秒浮点运算次数和每秒万亿(10的12次方)浮点运算的次数

Rmax - Maximal LINPACK performance

achieved linpack实际测试中达到的最大性能

Rpeak - Theoretical peak performance

理论最大性能。由理论推算出来的性能,不可能达到。

计算机的峰值速度通常是指其理论峰值速度,其计算公式是:

理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x

CPU数目

其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。

以IBM

POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为:

1.7G*2*2=6.8Gflop/s,或68亿次/秒。

对于满配置的IBM p690来说,该系统的峰值速度就是:

1.7G*2*2*32=217.6Gflops,或2176亿次/秒。

不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:

每个时钟周期能执行浮点运算的次数:

IBM

Power4 4

HPQ

PA-RISC 4

HPQ

Alpha 2

SUN

Ultra-Sparc 2

SGI

MIPS 2

Intel

Itanium 4

Intel

Pentium 1

Intel

Xeon 2

峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值