关于Float峰值计算的方法

最新推荐文章于 2023-05-25 11:39:34 发布

飞火流云

最新推荐文章于 2023-05-25 11:39:34 发布

阅读量1.8w

点赞数 2

分类专栏：高性能计算

本文链接：https://blog.csdn.net/cloudeagle_bupt/article/details/8840589

版权

高性能计算专栏收录该内容

25 篇文章 2 订阅

订阅专栏

linpack百度百科: http://baike.baidu.com/view/485828.htm

集群理论浮点峰值=CPU主频（GHz）×4（CPU每时钟周期执行浮点运算次数）×节点数×8（每节点双路四核）
例如单节点机CPU为Xeon E5430，则其理论峰值=1.66×4×1×8=53.12 GFLOPS

另外一个经常被用来评价计算机性能的简单指标是峰值速度。计算机的峰值速度通常是指其理论峰值速度，其计算公式是：

理论峰值速度（亿次）= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目/108

其中MHz是指CPU的主频，每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。以IBM POWER4为例，每个POWER4的处理器有两个浮点运算单元，每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz（POWER4+），那么该处理器的峰值速度为1.7G＊2＊2=6.8Gflop/s，或68亿次/秒。对于满配置的IBM p690来说，该系统的峰值速度就是1.7G＊2＊2＊32=217.6Gflops，或2176亿次/秒。不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下：
每个时钟周期能执行浮点运算的次数：
IBM Power4 4
HPQ PA-RISC 4
HPQ Alpha 2
SUN Ultra-Sparc 2
SGI MIPS 2
Intel Itanium 4
Intel Pentium 1
Intel Xeon 2

峰值速度在一定程度上能够反映处理器的性能，但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度，其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能，但可以作为对系统理论峰值性能的一个修正。

世界计算机TOP500排名就是以LINPACK的测试结果为基础的。

对于intel xeon e7-8837的理论flops计算是不是：
2.66（主频）×8（核心）×4（每周期浮点运算次数）=85.12 gflops
对于amd opteron 6220的峰值flops：
3（主频）×8（核心）×4（每周期浮点运算次数）=96 gflops
现在困惑在于CPU每周期浮点运算次数的参数查不到，我也是听说x86架构目前能达到4个浮点运算/时钟周期，而intel和amd都有某些型号产品能做到8个浮点运算/时钟周期，请教哪里能查到这个数据？或知道的请回帖告知以上两款CPU的每周期浮点运算次数，谢谢。
zouming1979 (站内联系TA)
目前大多数的理论峰值是按照x4的来计算，因为通常cpu核可以一拍执行两条指令，每条指令可以执行两个操作，因此是x4。
intel新架构的处理器增加了新的指令集AVX，因此一条指令可以执行四个操作，故新架构的处理器x8，也就说支持新指令集AVX的intel处理器都是x8。
新架构sandy bridge和ivy bridge都是x8。服务器处理器E5-XXXX， E3-XXXX都是x8。
PC机上用的处理器不清楚，不太关注。

AMD性能太差，现在也不太关注。
风间的记忆 (站内联系TA)
如LS所言
FLOPS只是理论数值
实际AMD虽高但实际性能并不好
牵扯CPU架构等很多方面
建议购买INTEL
psfan (站内联系TA)
2楼: Originally posted by zouming1979 at 2012-05-03 1840:
目前大多数的理论峰值是按照x4的来计算，因为通常cpu核可以一拍执行两条指令，每条指令可以执行两个操作，因此是x4。
intel新架构的处理器增加了新的指令集AVX，因此一条指令可以执行四个操作，故新架构的处理器 ...
请问e7-8837是x4还是x8？
zouming1979 (站内联系TA)
e7-8837 我看了一下不支持AVX指令集因此是x4
bluesxn (站内联系TA)
5楼: Originally posted by zouming1979 at 2012-05-04 1300
e7-8837 我看了一下不支持AVX指令集因此是x4

这里关于每秒钟的浮点运算的次数做一个说明:

目前大多数的理论峰值是按照x4的来计算，因为通常cpu核可以一拍执行两条指令，每条指令可以执行两个操作，因此是x4。
intel新架构的处理器增加了新的指令集AVX，因此一条指令可以执行四个操作，故新架构的处理器.

AVX指令集

Sandy Bridge和Larrabee架构新指令集

Intel的微架构也进入了全速发展的时期，在2010年4月结束的IDF峰会上Intel公司就发布了2010年的RoadMap。2011年1月Intel发布全新的处理器微架构Sandy Bridge，其中全新增加的指令集也将带来CPU性能的提升。

Intel公司将为Sandy Bridge带来全新的指令扩展集Intel Advanced Vector Extensions (Intel AVX)。AVX是在之前的128bit扩展到和256bit的SIMD(Single Instruction, Multiple Data)。而Sandy Bridge的SIMD演算单元扩展到256bits的同时数据传输也获得了提升，所以从理论上看CPU内核浮点运算性能提升到了2倍。

2倍啊亲!!!!!!!!!!

也是是说Sandy Bridge一个浮点8次啊亲！！！！！！！！

飞火流云

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
关于Float峰值计算的方法

linpack百度百科: http://baike.baidu.com/view/485828.htm 集群理论浮点峰值=CPU主频（GHz）×4（CPU每时钟周期执行浮点运算次数）×节点数×8（每节点双路四核）例如单节点机CPU为Xeon E5430，则其理论峰值=1.66×4×1×8=53.12 GFLOPS 另外一个经常被用来评价计算机性能的简单指标是峰值速
复制链接

扫一扫