计算能力

以下cpu内容摘自:点击打开链接

计算机的峰值速度通常是指其理论峰值速度,其计算公式是:

理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目

其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。

以IBM POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为:

1.7G*2*2=6.8Gflop/s,或68亿次/秒。

对于满配置的IBM p690来说,该系统的峰值速度就是:

1.7G*2*2*32=217.6Gflops,或2176亿次/秒。

 

不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:

每个时钟周期能执行浮点运算的次数:
HPQ PA-RISC          4
HPQ Alpha            2
SUN Ultra-Sparc      2
SGI MIPS             2
Intel Itanium        4
Intel Pentium        1
Intel Xeon           2

IBM Power4           4

 

峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。


以下gpu内容摘自:点击打开链接

GPU设备的单精度计算能力的理论峰值计算公式:

单精度计算能力的峰值 = 单核单周期计算次数 × 处理核个数 × 主频

   例如:   以GTX680为例,单核一个时钟周期单精度计算次数为两次,处理核个数 为1536, 主频为1006MHZ,那他的计算能力的峰值P 为P = 2 × 1536 × 1006MHZ = 3.09T FLOPS

   这里1MHZ = 1000000HZ,1T为1兆,也就是说,GTX680每秒可以进行超过3兆次的单精度运算。

同样,双精度的处理核为64个,不难算出,GTX680的双精度运算能力为0.13TFLOPS。



  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值