景派HPC研究院丨基于oneAPI的单节点四项基本测试
景派HPC研究院
由景派科技的技术团队组成,主要分享高性能计算领域的技术信息,与解答各位朋友在技术上遇到的问题和瓶颈,欢迎大家在文章下方的留言区讨论与提问。
平台信息:
CPU | 双路 AMD EPYC 7F52;每 CPU 16 个核心 共 32 物理核心(未启用 HT);L1d cache: 32K;L1i cache: 32K;L2 cache: 512K;L3 cache: 16384K;CPU MHz: 2500.000;CPU max MHz: 3500.0000;CPU min MHz: 2500.0000 |
---|---|
内存 | 16 GB * 24 条 DDR4 内存;总共可用内存为 377.81 GB;内存接口频率为 2666 MT/s;Total Width: 72 bits;Data Width: 64 bits |
磁盘 | 894.3 GB * 2 SSD |
测试依赖软件:
- Intel® oneAPI Base Toolkit
- Intel® oneAPI HPC Toolkit
- HPL 2.3
- OSU Micro-Benchmarks 5.7
- IOzone 3-491
- STREAM
HPL 测试
节点理论峰值性能 R p e a k R_{peak} Rpeak
R p e a k R_{peak} Rpeak的计算如公式 ( 1 ) (1) (1)。
R p e a k = ( C P U f r e q u e n c y i n G H z p e r c o r e ) × ( t o t a l n u m b e r o f c o r e s o n t h e m a c h i n e ) × ( f l o a t o p e r a t i o n s p e r C P U c y c l e ) (1) R_{peak} = (CPU\ frequency\ in\ GHz\ per\ core) \times (total\ number\ of\ cores\ on\ the\ machine) \times ( float\ operations\ per\ CPU\ cycle)\tag1 Rpeak=(CPU frequency in GHz per core)×(total number of cores on the machine)×(float operations per CPU cycle)(1)
其中CPU单周期浮点计算能力(float operations per CPU cycle, fpc)
的计算方法,对于有FMA单元的CPU如公式(2)、(3)所示[1]。
C P U 单 周 期 双 精 度 浮 点 计 算 能 力 = F M A 单 元 数 量 × 2 ( 同 时 加 法 和 乘 法 ) × 指 令 集 位 宽 ÷ 64 ( 双 精 度 位 宽 ) (2) CPU单周期双精度浮点计算能力=FMA单元数量\times 2(同时加法和乘法)\times指令集位宽\div64(双精度位宽)\tag2 CPU单周期双精度浮点计算能力=FMA单元数量×2(同时加法和乘法)×指令集位宽÷64(双精度位宽)(2)
C P U 单 周 期 单 精 度 浮 点 计 算 能 力 = F M A 单 元 数 量 × 2 ( 同 时 加 法 和 乘 法 ) × 指 令 集 位 宽 ÷ 32 ( 单 精 度 位 宽 ) (3) CPU单周期单精度浮点计算能力=FMA单元数量\times 2(同时加法和乘法)\times指令集位宽\div32(单精度位宽)\tag3 CPU单周期单精度浮点计算能力=FMA单元数量×2(同时加法和乘法)×