普通主机与淘宝服务器性能测对比,测试数据对比一

本文对比了AMD皓龙6174与英特尔至强X5670处理器在内存带宽和延迟方面的性能。皓龙6174借助DDR3内存控制器实现了130%的带宽提升,但在内存延迟测试中,英特尔至强处理器表现更优。在Blender2.5Alpha2的复杂渲染测试中,尽管皓龙6174在调整配置后有所改善,但总体仍不敌至强X5670。
摘要由CSDN通过智能技术生成

测试结果

随着英特尔和 AMD 向处理器中添加更多的核心,保持处理器扩展性面临两大挑战。缓存一致性信息会带来很多延迟并消耗大量带宽,与此同时处理器的核心本身对于带宽需求也与日俱增。因此内存准系统扮演了一个非常重要的角色。因此此次测评使用的基准为Stream TRIAD ,用于衡量内存带宽性能。

测试人员在 SUSE SLES 11 系统上运行 Stream TRIAD 基准测试。该测试分为四组数据,分别是复制、scale、添加以及 triad(以上三项的综合)。

727def523bd76eaa6ad5ecf4fdf1ce61.png

运行在64位Linux系统上的Stream TRIAD基准测试(最大线程数),数值越大,性能越高

全新的 DDR 3 内存控制器让皓龙 6100 系列如虎添翼。同使用 DDR-2 800 的皓龙 2435 相比,前者将带宽提升了 130%。这样每个处理核心就分配到更大的带宽,非常有助于 HPC 应用程序。当然 1.8 GHz 的北桥对于内存子系统的限制也是一个小小的遗憾。要是能看到带有高主频北桥的 8 核版本的处理器锁定 HPC 市场是多么的有趣。同样要注意到全新至强 5600 系列对于 DDR3-1333 的控制更为高效。实际测试发现,在 DDR3-1333 DIMM 下,相比老款的至强 5570,前者多出了 15% 的带宽。此次测试结果数据显示,皓龙 6174 占据较大优势。

除了测试内存带宽因素外,另一个评价内存子系统的尺度就是延迟。此次延迟测试中使用的是 Sisoft Sandra 2010。

主频 L1 (Clocks) L2 (Clocks) L3 (Clocks) 内存(ns)

Intel Xeon X5670 2.93GHz 4 10 56 87

Intel Xeon X5570 2.80GHz 4 9 47 81

AMD Opteron 6174 2.20GHz 3 16 57 98

AMD Opteron 2435 2.60GHz 3 16 56 113

在 Nehalem 架构下,英特尔将一级缓存的的延迟从 3 个周期延长至 4 个。这种做法意为着在基本架构的演变下,留出将来的可拓展性的空间。至强处理器二级缓存容量虽然最小(256 KB),但是速度最快。至强 X 5570 的三级缓存速度是最快的,但是考虑到至强 X5670 的缓存从 8 MB 增加到 12 MB,因此延迟的优势也基本消失殆尽。英特尔从 DDR2-800 到DDR3-1333 的转变反而减少了大约 15% 的到内存子系统延迟。这对于更多带宽和每个核心较低延迟的 12 核皓龙处理器而言是个好消息。内存延迟性能测试,英特尔至强家族全面获胜!

复杂场景渲染测试:Blender 2.5 Alpha 2 (Windows 2008 R2平台下)

Blender 2.5 Alpha 2

操作系统 Windows 2008 Enterprise R2 (64位)

软件 Blender 2.5 Alpha 2

基准软件 内置渲染引擎

之所以未能采用 3dsmax 2010 来做渲染测试,是因为这是专门针对工作站渲染能力的测试软件,此外 3dsmax 2010 可以说几乎是所有服务器的梦魇。综合考虑测评人员最后还是选择了 Blender。当前最稳定的版本为 Blender 2.49,但最多只能支持 8 个线程。而Blender 2.5 alpha 2 能够支持 64 个线程,出乎意料之外的是,该版本也很稳定,因此就选用了 Blender 2.5 alpha 2。

在 Blender 2.5 alpha 2 中,测评人员选择了 metallic rob 场景渲染,该场景有着非常复杂的光照效果(很多反射)和光线追踪。为了让基准测试更具重复性,于是更改了部分参数设置。分辨率设置为 2560 x 1600;反锯齿设置为 16;禁用后处理中的影像合成;贴图(Tile)设置为 8x8 (X=8, Y=8);线程设置为自动(每个 CPU 一个线程已设定)。

eaad3a48c96e569225d428b57d70b0bf.png

Blender 2.5 alpha 2 中的metallic rob 场景渲染图

让我们先看看 Windows 2008 R2 上的 Blender 2.5 alpha 2的测试结果吧!

eaad3a48c96e569225d428b57d70b0bf.png

Blender 2.5 alpha 2在Windows 2008 R2上的测试结果,数据为时间(秒),越低越好

刚开始测试皓龙 6174 的结果很糟糕,为 44.6 秒,比 6 核的 dual 皓龙处理器还要慢。专业人士指出默认贴图(Tile)设置为 5x5,这会在短时间内对皓龙 6174 处理器构成 100% 的工作负荷压力,但是就长期而言,处理器的工作负荷会下降至 30% 之下。经过一系列的实验之后,终于发现8x8 贴图(Tile)设置适用于所有测试机器,至强和 6 核皓龙速度提升了 10%,而12 核皓龙则更是提高了 40%。通过此次测试结果可以看出,对于复杂场景的渲染,相对皓龙 6174 而言,英特尔至强 X5670 还是占据一定优势。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值