普通主机与淘宝服务器性能测对比,测试数据对比一

最新推荐文章于 2022-07-03 17:14:04 发布

何奇艺

最新推荐文章于 2022-07-03 17:14:04 发布

阅读量312

点赞数

文章标签：普通主机与淘宝服务器性能测对比

本文对比了AMD皓龙6174与英特尔至强X5670处理器在内存带宽和延迟方面的性能。皓龙6174借助DDR3内存控制器实现了130%的带宽提升，但在内存延迟测试中，英特尔至强处理器表现更优。在Blender2.5Alpha2的复杂渲染测试中，尽管皓龙6174在调整配置后有所改善，但总体仍不敌至强X5670。

摘要由CSDN通过智能技术生成

测试结果

随着英特尔和 AMD 向处理器中添加更多的核心，保持处理器扩展性面临两大挑战。缓存一致性信息会带来很多延迟并消耗大量带宽，与此同时处理器的核心本身对于带宽需求也与日俱增。因此内存准系统扮演了一个非常重要的角色。因此此次测评使用的基准为Stream TRIAD ，用于衡量内存带宽性能。

测试人员在 SUSE SLES 11 系统上运行 Stream TRIAD 基准测试。该测试分为四组数据，分别是复制、scale、添加以及 triad(以上三项的综合)。

运行在64位Linux系统上的Stream TRIAD基准测试(最大线程数)，数值越大，性能越高

全新的 DDR 3 内存控制器让皓龙 6100 系列如虎添翼。同使用 DDR-2 800 的皓龙 2435 相比，前者将带宽提升了 130%。这样每个处理核心就分配到更大的带宽，非常有助于 HPC 应用程序。当然 1.8 GHz 的北桥对于内存子系统的限制也是一个小小的遗憾。要是能看到带有高主频北桥的 8 核版本的处理器锁定 HPC 市场是多么的有趣。同样要注意到全新至强 5600 系列对于 DDR3-1333 的控制更为高效。实际测试发现，在 DDR3-1333 DIMM 下，相比老款的至强 5570，前者多出了 15% 的带宽。此次测试结果数据显示，皓龙 6174 占据较大优势。

除了测试内存带宽因素外，另一个评价内存子系统的尺度就是延迟。此次延迟测试中使用的是 Sisoft Sandra 2010。

主频 L1 (Clocks) L2 (Clocks) L3 (Clocks) 内存(ns)

Intel Xeon X5670 2.93GHz 4 10 56 87

Intel Xeon X5570 2.80GHz 4 9 47 81

AMD Opteron 6174 2.20GHz 3 16 57 98

AMD Opteron 2435 2.60GHz 3 16 56 113

在 Nehalem 架构下，英特尔将一级缓存的的延迟从 3 个周期延长至 4 个。这种做法意为着在基本架构的演变下，留出将来的可拓展性的空间。至强处理器二级缓存容量虽然最小(256 KB)，但是速度最快。至强 X 5570 的三级缓存速度是最快的，但是考虑到至强 X5670 的缓存从 8 MB 增加到 12 MB，因此延迟的优势也基本消失殆尽。英特尔从 DDR2-800 到DDR3-1333 的转变反而减少了大约 15% 的到内存子系统延迟。这对于更多带宽和每个核心较低延迟的 12 核皓龙处理器而言是个好消息。内存延迟性能测试，英特尔至强家族全面获胜！

复杂场景渲染测试：Blender 2.5 Alpha 2 (Windows 2008 R2平台下)

Blender 2.5 Alpha 2

操作系统 Windows 2008 Enterprise R2 (64位)

软件 Blender 2.5 Alpha 2

基准软件内置渲染引擎

之所以未能采用 3dsmax 2010 来做渲染测试，是因为这是专门针对工作站渲染能力的测试软件，此外 3dsmax 2010 可以说几乎是所有服务器的梦魇。综合考虑测评人员最后还是选择了 Blender。当前最稳定的版本为 Blender 2.49，但最多只能支持 8 个线程。而Blender 2.5 alpha 2 能够支持 64 个线程，出乎意料之外的是，该版本也很稳定，因此就选用了 Blender 2.5 alpha 2。

在 Blender 2.5 alpha 2 中，测评人员选择了 metallic rob 场景渲染，该场景有着非常复杂的光照效果(很多反射)和光线追踪。为了让基准测试更具重复性，于是更改了部分参数设置。分辨率设置为 2560 x 1600；反锯齿设置为 16；禁用后处理中的影像合成；贴图(Tile)设置为 8x8 (X=8, Y=8)；线程设置为自动(每个 CPU 一个线程已设定)。

Blender 2.5 alpha 2 中的metallic rob 场景渲染图

让我们先看看 Windows 2008 R2 上的 Blender 2.5 alpha 2的测试结果吧！

Blender 2.5 alpha 2在Windows 2008 R2上的测试结果，数据为时间(秒)，越低越好

刚开始测试皓龙 6174 的结果很糟糕，为 44.6 秒，比 6 核的 dual 皓龙处理器还要慢。专业人士指出默认贴图(Tile)设置为 5x5，这会在短时间内对皓龙 6174 处理器构成 100% 的工作负荷压力，但是就长期而言，处理器的工作负荷会下降至 30% 之下。经过一系列的实验之后，终于发现8x8 贴图(Tile)设置适用于所有测试机器，至强和 6 核皓龙速度提升了 10%，而12 核皓龙则更是提高了 40%。通过此次测试结果可以看出，对于复杂场景的渲染，相对皓龙 6174 而言，英特尔至强 X5670 还是占据一定优势。