4节点服务器优势,性能提升30% 惠普四节点全能服务器评测(5)

SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

fb13a797f79a0013ba28ec9d64e55551.png

SPEC2006测试结果分为整数和浮点两部分,我们先看到的是整数部分的成绩。从结果来看,由于两台服务器使用了同样的处理器,从理论来说结果应该非常接近才对。但是我们看到,在大多数测试项目中,惠普DL4x170h G6服务器都有着明显的领先优势。虽然SPEC2006侧重于考察处理器的性能,但是在运行过程中对内存容量的要求也很高,在大容量内存的支持下更容易获得好成绩。另外,惠普DL4x170h G6服务器使用的是三通道设计,而对比平台只有双通道,这也会在一定程度上对性能造成影响。

从结果来看,惠普DL4x170h G6服务器在许多项目中领先对比平台10%到30%之间,同时我们也发现了对内存容量并不敏感的项目,比如453影像光线追踪和447有限元分析等等。

SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

a6aa0a3679555a983ff52c9a3202dc07.png

整数测试中,惠普DL4x170h G6服务器高歌猛进,取得了不小的领先优势;而在浮点项目中,虽然多数项目中惠普DL4x170h G6服务器依旧领先,但是从幅度来看有所降低,两者差距较小,这也说明浮点测试对于内存的依赖性并不大。

SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

SiSoftware Sandra Pro Business 2009

测试对象

惠普ProLiant DL4x170h G6

单路Intel Gainestown

Xeon E5504

2.0GHz

单路Intel Gainestown

Xeon E5504

2.0GHz

Processor Arithmetic Benchmark

处理器架构测试

Dhrystone ALU

49337MIPS

49318MIPS

Dhrystone ALU vs SPEED

24.67MIPS/MHz

24.66MIPS/MHz

Whetstone iSSE3

25620MFLOPS

26064MFLOPS

Dhrystone iSSE3 vs SPEED

12.81MFLOPS/MHz

13.03MFLOPS/MHz

Processor Multi-Media Benchmark

处理器多媒体测试

Multi-Media Int x16 iSSE4.1

84.93MPixel/s

84.83MPixel/s

Multi-Media Int x16 iSSE4.1 vs SPEED

42.47kPixels/s/MHz

42.41kPixel/s/MHz

Multi-Media Float x8 iSSE2

64.79MPixel/s

64.72MPixel/s

Multi-Media Float x8 iSSE2 vs SPEED

32.39kPixels/s/MHz

32.36kPixels/s/MHz

Multi-Media Double x4 iSSE2

33.81MPixel/s

33.81MPixel/s

Multi-Media Double x4 iSSE2 vs SPEED

16.91kPixels/s/MHz

16.91kPixels/s/MHz

Multi-Core Efficiency Benchmark

Inter-Core Bandwidth

9.81GB/s

9.73GB/s

Inter-Core Bandwidth vs SPEED

5.02MB/s/MHz

4.98MB/s/MHz

Inter-Core Latency

(越小越好)

80ns

74ns

Inter-Core Latency vs SPEED

(越小越好)

0.04ns/MHz

0.04ns/MHz

Cryptography

加密性能测试

AES256 CPU Cryptographic Bandwidth

326MB/s

326MB/s

AES256 CPU Cryptographic Bandwidth VS SPEED

0.16MB/s/MHz

0.16MB/s/MHz

SHA256 CPU Hashing Bandwidth

373MB/s

373MB/s

SHA256 CPU Hashing Bandwidth vs SPEED

0.19MB/s/MHz

0.19MB/s/MHz

.NET Arithmetic Benchmark

.NET架构测试

Dhrystone .NET

6991MIPS

8103MIPS

Dhrystone .NET vs SPEED

3.50MIPS/MHz

4.05MIPS/MHz

Whetstone .NET

17130MFLOPS

17394MFLOPS

Whetstone .NET vs SPEED

8.56MFLOPS/MHz

8.70MFLOPS/MHz

.NET Multi-Media Benchmark

.NET多媒体测试

Multi-Media Int x1 .NET

16.92MPixel/s

17.02MPixel/s

Multi-Media Int x1 .NET vs SPEED

8.46kPixels/s/MHz

8.51kPixels/s/MHz

Multi-Media Float x1 .NET

5.01MPixel/s

4.99MPixel/s

Multi-Media Float x1 .NET vs SPEED

2.51kPixels/s/MHz

2.49kPixels/s/MHz

Multi-Media Double x1 .NET

9.19MPixel/s

9.28MPixel/s

Multi-Media Double x1 .NET vs SPEED

4.60kPixels/s/MHz

4.64kPixels/s/MHz

这个项目是处理器常规性能测试。由于惠普DL4x170h G6服务器和对比平台使用了同样的至强E5504处理器,因此在这个项目中的差距不大,除了最后的.NET架构和多媒体性能测试之外,惠普DL4x170h G6服务器大部分时候有着微弱的领先优势。

SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。

SiSoftware Sandra Pro Business 2009

测试对象

惠普ProLiant DL4x170h G6

单路Intel Gainestown

Xeon E5504

2.0GHz

单路Intel Gainestown

Xeon E5504

2.0GHz

Memory Bandwidth Benchmark

内存带宽测试

Int Buff'd iSSE2 Memory Bandwidth

14.01GB/s

9.98GB/s

Float Buff'd iSSE2 Memory Bandwidth

12.07GB/s

9.98GB/s

Memory Latency Benchmark(Random)

内存延迟测试(随机)

Memory(Random Access) Latency

(越小越好)

109ns

108ns

Speed Factor

(越小越好)

53.40

52.50

Internal Data Cache

4clocks

4clocks

L2 On-board Cache

10clocks

10clocks

L3 On-board Cache

48clocks

48clocks

Memory Latency Benchmark(Linear)

内存延迟测试(线性)

Memory(Linear Access) Latency

(越小越好)

9ns

9ns

Speed Factor

(越小越好)

4.50

4.40

Internal Data Cache

4clocks

4clocks

L2 On-board Cache

10clocks

10clocks

L3 On-board Cache

12clocks

12clocks

Cache and Memory Benchmark

缓存及内存测试

Cache/Memory Bandwidth

43.25GB/s

36.81GB/s

Cache/Memory Bandwidth vs SPEED

22.14MB/s/MHz

18.85MB/s/MHz

Speed Factor

(越小越好)

21.50

33.40

Internal Data Cache

159.31GB/s

163.13GB/s

L2 On-board Cache

135.65GB/s

137.45GB/s

但是到内存测试项目,两者的差距就体现出来了。由于惠普DL4x170h G6服务器实现了三通道设计,而对比平台只有双通道,因此在内存带宽中两者差距明显,幅度分别达到了40%和20%。和SPEC2006对于内存的依赖不同,这个项目只是对于内存带宽(通道数量)有要求,而对于内存容量则并不敏感。

ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

ScienceMark Membench

厂商

惠普

Intel

产品型号

惠普ProLiant DL4x170h G6

单路Intel Gainestown

Xeon E5504

2.0GHz

单路Intel Gainestown

Xeon E5504

内存技术参数

2GB R-ECC DDR3-800 SDRAM x8

三通道

2GB R-ECC DDR3-800 SDRAM x4

双通道

L1带宽(MB/s)

59785.03

47877.41

L2带宽(MB/s)

24392.68

19561.78

内存带宽(MB/s)

9753.54

8833.57

L1 Cache Latency(ns)

32 Bytes Stride

3 cycles

1.50 ns

3 cycles

1.50 ns

L1 Algorithm Bandwidth(MB/s)

Compiler

52980.69

42198.88

REP MOVSD

54366.01

43498.52

ALU Reg Copy

15060.05

12067.10

MMX Reg Copy

30215.90

24173.05

SSE PAlign

59785.03

47830.32

SSE2 PAlign

58639.54

47877.41

L2 Cache Latency(ns)

4 Bytes Stride

4 cycles

2.00 ns

4 cycles

2 ns

16 Bytes Stride

4 cycles

2.00 ns

4 cycles

2 ns

64 Bytes Stride

10 cycles

5.00 ns

10 cycles

5 ns

256 Bytes Stride

9 cycles

4.50 ns

9 cycles

4.50 ns

512 Bytes Stride

8 cycles

4.00 ns

8 cycles

4 ns

L2 Algorithm Bandwidth(MB/s)

Compiler

22624.80

17957.58

REP MOVSD

24392.68

19596.05

ALU Reg Copy

10970.33

8778.56

MMX Reg Copy

17562.86

14063.17

SSE PAlign

23344.86

18656.42

SSE2 PAlign

23361.11

18677.19

Memory Latency(ns)

4 Bytes Stride

4 cycles

2.00 ns

4 cycles

2 ns

16 Bytes Stride

5 cycles

2.50 ns

5 cycles

2.50 ns

64 Bytes Stride

17 cycles

8.50 ns

17 cycles

8.50 ns

256 Bytes Stride

94 cycles

47.00 ns

92 cycles

46.00 ns

512 Bytes Stride

110 cycles

55.00 ns

104 cycles

52.00 ns

Memory Algorithm Bandwidth(MB/s)

Compiler

9293.20

7918.04

REP MOVSD

9753.54

8833.57

ALU Reg Copy

6376.50

5631.16

MMX Reg Copy

6985.65

5880.52

MMX Reg 3dNow

-

-

MMX Reg SSE

8560.05

8398.25

SSE PAlign

9150.80

8750.74

SSE PAlign SSE

8996.74

8715.17

SSE2 PAlign

9160.76

8749.69

SSE2 PAlign SSE

9001.75

8724.84

MMX Block 4kb

7748.20

7648.23

MMX Block 16kb

8636.91

8515.20

SSE Block 4kb

7838.92

7731.28

SSE Block 16kb

8753.36

8620.84

得益于三通道,这个项目中惠普DL4x170h G6服务器的内存带宽高出了对比服务器近1000MB/s,由此看到两者的差异非常明显。在内存指令(集)中,除了部分项目结果较为接近之外,差距还是非常大的。同样,这个项目的测试结果与内存容量并没有直接的关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值