作为中端产品,如SLI、SDI等高级功能就没有提供,不过,FX 1800具有Quadro中的精髓部分:CUDA GPU计算功能。
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。它是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。在架构上采用了一种全新的计算体系结构来使用GPU提供的硬件资源,从而给大规模的数据计算应用提供了一种比CPU更加强大的计算能力。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
通过使用CUDA,图形工作站将可以充分地应用到Quadro显卡的强大计算能力。
Quadro FX 1800属于第十代Quadro的中端产品
64个GPU,192-bit 768MB GDDR3显存,带宽达到了38.4GB/s,FX 1800提供了30位色输出(10位像素),FX 1800不支持SDI和SLI。
FX 1800使用了PCI-E 2.0 x16界面,最大59W的功耗让其只需要单槽位设计,FX 1800还提供了新世代的输出方式:两个DisplayPort接口和1个DualLink DVI-I接口,DisplayPort与通常的DVI、HDMI接口相比都具有独特的优势。
DisplayPort接口(左)与HDMI接口(右)都非常小巧
从尺寸上看,与DVI和D-Sub相比,HDMI与DisplayPort无疑都非常小巧,对于在各种设备上的应用来说,拥有极高的便利性。和HDMI一样,DisplayPort也允许音频与视频信号共用一条线缆传输,支持多种高质量数字音频。但DisplayPort一条线缆上还可实现更多的功能,它目前提供了10.8Gb/s的带宽,日后将会发展至21.6Gb/s(而HDMI 1.3所提供的带宽为10.2Gb/s),极高的带宽让DisplayPort可以轻松支持极大的分辨率:WQXGA+(2560×1600)及以上,同时还能支持30/36bit(每原色10/12bit)的色深。
此外,DisplayPort还可以直接驱动面板进行显示,不需要再通过会降低响应时间的LVDS转换电路,最后也是最重要的一点:DisplayPort还是一个完全开放授权的技术,使用上完全免费。
Quadro FX1800的造型没有FX1700那么开放,而是使用了一体化的散热,显卡的散热器放在了核心右侧。由于包裹得太严密,在外壳正面我们只能看到NVIDIA Quadro的字样,而右上角的Quadro FX1800说明了它的型号。
好不容易拆掉了外壳的导风罩(5颗螺丝),我们看到Quadro FX1800的内部构造较为简单。显卡的大面积区域被散热片覆盖。
测试平台、测试环境 | ||||||||
测试分组 | ||||||||
类别 | Quadro FX1800平台 | HP xw8600 Workstation | ||||||
处理器子系统 | ||||||||
处理器 | Intel Nehalem-EP E5540 | 双路Intel Xeon E5430 | ||||||
处理器代号 | Gainestown | Harpertown | ||||||
处理器封装 | Socket 1366 LGA | Socke 771 LGA | ||||||
处理器规格 | 四核超线程 内置内存控制器 | 四核 | ||||||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | ||||||
主频 | 2.53GHz | 2.66GHz | ||||||
处理器外部总线 | QPI Link:2933MHz | FSB:1333MHz | ||||||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | ||||||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | ||||||
L2 Cache | 4x 256KB 8路集合关联 | 2x 6MB 24路集合关联 | ||||||
L3 Cache | 8MB 16路集合关联 | - | ||||||
主板 | ||||||||
主板型号 | 华硕P6T6 WS Revolution | HP | ||||||
北桥芯片组(MCH) | Intel X58 | Intel 5400 | ||||||
北桥芯片特性 | Intel VT-d技术 | 24MB Snoop Filter | ||||||
内存控制器 | 处理器内置三通道DDR3 | 北桥集成四通道FB-DDR2 | ||||||
内存 | 1GB DDR3 1066 SDRAM x3 | 2GB FB-DDR2 667 SDRAM x4 | ||||||
系统磁盘子系统 | ||||||||
磁盘控制器 | LSI SAS 3041E-R | LSI SAS1068E Controller | ||||||
磁盘控制器规格 | SATA 3Gbps x4 | SAS 3Gbps x8 | ||||||
磁盘控制器设置 | RAID 0 | HostRAID 0 | ||||||
磁盘控制器驱动 | LSI SAS 1.28.03.00 | LSI?SAS 2.23.0.64 | ||||||
磁盘 | Seagate Cheetah 15K.5 ST314655SS 146GB 16MB SAS x2 | Fujitsu MBA3300RC x2 | ||||||
磁盘规格 | 15000RPM 146GB SAS 3Gbps 16MB Cache | 15000RPM | ||||||
磁盘设置 | SATA 3Gbps 50GB系统分区 | SAS 3Gbps 50GB系统分区 | ||||||
图形子系统 | ||||||||
显卡 | NVIDIA Quadro FX 1800 | NVIDIA Quadro FX 4600 | ||||||
显卡参数 | 768MB RAM | 768MB RAM | ||||||
显卡驱动 | NVIDIA Quadro 182.46 WHQL for Windows XP | NVIDIA Quadro 181.20 WHQL for Vista64 | ||||||
软件环境 | ||||||||
操作系统 | Microsoft Windows XP SP3 32Bit | Microsoft Windows Vista Ultimate x64 SP1 |
我们使用华硕P6T6 WS Revolution主板搭建了一套中端工作站平台。处理器方面,我们选择了使用Nehalem-EP核心的至强E5540。这款处理器是目前Nehalem-EP产品线中的主流产品,也是Intel英特尔刚刚发布的处理器,性能强大。硬盘方面,我们选择了希捷Seagate Cheetah 15K.5硬盘,转速为15000rpm,使用两块组成RAID 0阵列,获得更好的性能。测试中,我们并没有使用P6T6 WS Revolution主板自带的阵列芯片,而是采用了LSI SAS 3041E-R卡,它是一款4端口3Gbps SAS卡,集成RAID 0、RAID 1、RAID 1E和10E功能,用在这里绰绰有余。
值得一提的是,为了便于大家观察Quadro FX1800的性能提升,我们选择了惠普xw8600工作站进行对比,这款工作站使用了Quadro FX4600显卡,是Quadro产品线偏高端的产品,NVIDIA对它的描述是“卓越图像品质”。不过由于测试平台存在着较大差异,我们这里提供的对比数据仅供参考