以下cpu内容摘自:点击打开链接
计算机的峰值速度通常是指其理论峰值速度,其计算公式是:
理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目
其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。
以IBM POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为:
1.7G*2*2=6.8Gflop/s,或68亿次/秒。
对于满配置的IBM p690来说,该系统的峰值速度就是:
1.7G*2*2*32=217.6Gflops,或2176亿次/秒。
不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:
每个时钟周期能执行浮点运算的次数:
HPQ PA-RISC
HPQ Alpha
SUN Ultra-Sparc
SGI MIPS
Intel Itanium
Intel Pentium
Intel Xeon
IBM Power4
峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。
以下gpu内容摘自:点击打开链接
GPU设备的单精度计算能力的理论峰值计算公式:
单精度计算能力的峰值 = 单核单周期计算次数 × 处理核个数 × 主频
例如: 以GTX680为例,单核一个时钟周期单精度计算次数为两次,处理核个数 为1536, 主频为1006MHZ,那他的计算能力的峰值P 为P = 2 × 1536 × 1006MHZ = 3.09T FLOPS
这里1MHZ = 1000000HZ,1T为1兆,也就是说,GTX680每秒可以进行超过3兆次的单精度运算。
同样,双精度的处理核为64个,不难算出,GTX680的双精度运算能力为0.13TFLOPS。