SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC2006测试结果分为整数和浮点两部分,我们先看到的是整数部分的成绩。从结果来看,由于两台服务器使用了同样的处理器,从理论来说结果应该非常接近才对。但是我们看到,在大多数测试项目中,惠普DL4x170h G6服务器都有着明显的领先优势。虽然SPEC2006侧重于考察处理器的性能,但是在运行过程中对内存容量的要求也很高,在大容量内存的支持下更容易获得好成绩。另外,惠普DL4x170h G6服务器使用的是三通道设计,而对比平台只有双通道,这也会在一定程度上对性能造成影响。
从结果来看,惠普DL4x170h G6服务器在许多项目中领先对比平台10%到30%之间,同时我们也发现了对内存容量并不敏感的项目,比如453影像光线追踪和447有限元分析等等。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
整数测试中,惠普DL4x170h G6服务器高歌猛进,取得了不小的领先优势;而在浮点项目中,虽然多数项目中惠普DL4x170h G6服务器依旧领先,但是从幅度来看有所降低,两者差距较小,这也说明浮点测试对于内存的依赖性并不大。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2009
测试对象
惠普ProLiant DL4x170h G6
单路Intel Gainestown
Xeon E5504
2.0GHz
单路Intel Gainestown
Xeon E5504
2.0GHz
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
49337MIPS
49318MIPS
Dhrystone ALU vs SPEED
24.67MIPS/MHz
24.66MIPS/MHz
Whetstone iSSE3
25620MFLOPS
26064MFLOPS
Dhrystone iSSE3 vs SPEED
12.81MFLOPS/MHz
13.03MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
84.93MPixel/s
84.83MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
42.47kPixels/s/MHz
42.41kPixel/s/MHz
Multi-Media Float x8 iSSE2
64.79MPixel/s
64.72MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
32.39kPixels/s/MHz
32.36kPixels/s/MHz
Multi-Media Double x4 iSSE2
33.81MPixel/s
33.81MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
16.91kPixels/s/MHz
16.91kPixels/s/MHz
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
9.81GB/s
9.73GB/s
Inter-Core Bandwidth vs SPEED
5.02MB/s/MHz
4.98MB/s/MHz
Inter-Core Latency
(越小越好)
80ns
74ns
Inter-Core Latency vs SPEED
(越小越好)
0.04ns/MHz
0.04ns/MHz
Cryptography
加密性能测试
AES256 CPU Cryptographic Bandwidth
326MB/s
326MB/s
AES256 CPU Cryptographic Bandwidth VS SPEED
0.16MB/s/MHz
0.16MB/s/MHz
SHA256 CPU Hashing Bandwidth
373MB/s
373MB/s
SHA256 CPU Hashing Bandwidth vs SPEED
0.19MB/s/MHz
0.19MB/s/MHz
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
6991MIPS
8103MIPS
Dhrystone .NET vs SPEED
3.50MIPS/MHz
4.05MIPS/MHz
Whetstone .NET
17130MFLOPS
17394MFLOPS
Whetstone .NET vs SPEED
8.56MFLOPS/MHz
8.70MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
16.92MPixel/s
17.02MPixel/s
Multi-Media Int x1 .NET vs SPEED
8.46kPixels/s/MHz
8.51kPixels/s/MHz
Multi-Media Float x1 .NET
5.01MPixel/s
4.99MPixel/s
Multi-Media Float x1 .NET vs SPEED
2.51kPixels/s/MHz
2.49kPixels/s/MHz
Multi-Media Double x1 .NET
9.19MPixel/s
9.28MPixel/s
Multi-Media Double x1 .NET vs SPEED
4.60kPixels/s/MHz
4.64kPixels/s/MHz
这个项目是处理器常规性能测试。由于惠普DL4x170h G6服务器和对比平台使用了同样的至强E5504处理器,因此在这个项目中的差距不大,除了最后的.NET架构和多媒体性能测试之外,惠普DL4x170h G6服务器大部分时候有着微弱的领先优势。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009
测试对象
惠普ProLiant DL4x170h G6
单路Intel Gainestown
Xeon E5504
2.0GHz
单路Intel Gainestown
Xeon E5504
2.0GHz
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
14.01GB/s
9.98GB/s
Float Buff'd iSSE2 Memory Bandwidth
12.07GB/s
9.98GB/s
Memory Latency Benchmark(Random)
内存延迟测试(随机)
Memory(Random Access) Latency
(越小越好)
109ns
108ns
Speed Factor
(越小越好)
53.40
52.50
Internal Data Cache
4clocks
4clocks
L2 On-board Cache
10clocks
10clocks
L3 On-board Cache
48clocks
48clocks
Memory Latency Benchmark(Linear)
内存延迟测试(线性)
Memory(Linear Access) Latency
(越小越好)
9ns
9ns
Speed Factor
(越小越好)
4.50
4.40
Internal Data Cache
4clocks
4clocks
L2 On-board Cache
10clocks
10clocks
L3 On-board Cache
12clocks
12clocks
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
43.25GB/s
36.81GB/s
Cache/Memory Bandwidth vs SPEED
22.14MB/s/MHz
18.85MB/s/MHz
Speed Factor
(越小越好)
21.50
33.40
Internal Data Cache
159.31GB/s
163.13GB/s
L2 On-board Cache
135.65GB/s
137.45GB/s
但是到内存测试项目,两者的差距就体现出来了。由于惠普DL4x170h G6服务器实现了三通道设计,而对比平台只有双通道,因此在内存带宽中两者差距明显,幅度分别达到了40%和20%。和SPEC2006对于内存的依赖不同,这个项目只是对于内存带宽(通道数量)有要求,而对于内存容量则并不敏感。
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。
ScienceMark Membench
厂商
惠普
Intel
产品型号
惠普ProLiant DL4x170h G6
单路Intel Gainestown
Xeon E5504
2.0GHz
单路Intel Gainestown
Xeon E5504
内存技术参数
2GB R-ECC DDR3-800 SDRAM x8
三通道
2GB R-ECC DDR3-800 SDRAM x4
双通道
L1带宽(MB/s)
59785.03
47877.41
L2带宽(MB/s)
24392.68
19561.78
内存带宽(MB/s)
9753.54
8833.57
L1 Cache Latency(ns)
32 Bytes Stride
3 cycles
1.50 ns
3 cycles
1.50 ns
L1 Algorithm Bandwidth(MB/s)
Compiler
52980.69
42198.88
REP MOVSD
54366.01
43498.52
ALU Reg Copy
15060.05
12067.10
MMX Reg Copy
30215.90
24173.05
SSE PAlign
59785.03
47830.32
SSE2 PAlign
58639.54
47877.41
L2 Cache Latency(ns)
4 Bytes Stride
4 cycles
2.00 ns
4 cycles
2 ns
16 Bytes Stride
4 cycles
2.00 ns
4 cycles
2 ns
64 Bytes Stride
10 cycles
5.00 ns
10 cycles
5 ns
256 Bytes Stride
9 cycles
4.50 ns
9 cycles
4.50 ns
512 Bytes Stride
8 cycles
4.00 ns
8 cycles
4 ns
L2 Algorithm Bandwidth(MB/s)
Compiler
22624.80
17957.58
REP MOVSD
24392.68
19596.05
ALU Reg Copy
10970.33
8778.56
MMX Reg Copy
17562.86
14063.17
SSE PAlign
23344.86
18656.42
SSE2 PAlign
23361.11
18677.19
Memory Latency(ns)
4 Bytes Stride
4 cycles
2.00 ns
4 cycles
2 ns
16 Bytes Stride
5 cycles
2.50 ns
5 cycles
2.50 ns
64 Bytes Stride
17 cycles
8.50 ns
17 cycles
8.50 ns
256 Bytes Stride
94 cycles
47.00 ns
92 cycles
46.00 ns
512 Bytes Stride
110 cycles
55.00 ns
104 cycles
52.00 ns
Memory Algorithm Bandwidth(MB/s)
Compiler
9293.20
7918.04
REP MOVSD
9753.54
8833.57
ALU Reg Copy
6376.50
5631.16
MMX Reg Copy
6985.65
5880.52
MMX Reg 3dNow
-
-
MMX Reg SSE
8560.05
8398.25
SSE PAlign
9150.80
8750.74
SSE PAlign SSE
8996.74
8715.17
SSE2 PAlign
9160.76
8749.69
SSE2 PAlign SSE
9001.75
8724.84
MMX Block 4kb
7748.20
7648.23
MMX Block 16kb
8636.91
8515.20
SSE Block 4kb
7838.92
7731.28
SSE Block 16kb
8753.36
8620.84
得益于三通道,这个项目中惠普DL4x170h G6服务器的内存带宽高出了对比服务器近1000MB/s,由此看到两者的差异非常明显。在内存指令(集)中,除了部分项目结果较为接近之外,差距还是非常大的。同样,这个项目的测试结果与内存容量并没有直接的关系。