GPU服务器技术要求
本文档详细阐述了GPU服务器的技术规格要求,旨在为用户提供高性能计算解决方案。以下是服务器的主要技术参数和厂商要求。
服务器规格
- 机箱:4U 机架式
- CPU:Intel Xeon Silver 4110,主频2.1GHz,16核32线程,数量2个
- 内存:配置8根32GB DDR4 2666MHz ECC Reg 内存条,最大支持24根内存条
- 硬盘:配置1块Seagate 6TB 3.5企业级硬盘 7200RPM 128MB缓存,1块Intel S4500 480G 2.5SSD,最大支持24块2.5寸硬盘
- 电源:2+2冗余电源,额定功率2000W
- 系统:4U BB LGA2011 E5-2600v3 SM SYS-4029GP-TRT2 PCI-E插槽,包括PCI-E第3代16速插槽11个,PCI-E第3代8速插槽1个,Mezzanine接口1个
- 机箱尺寸:180 x440 x740 (H x W x D,mm)
GPU规格
- 显卡数量:4块
- 显卡型号:NVIDIA Tesla P100 GPU,GPU主频1.45GHz,CUDA核心数3584,显存16G
软件要求
- GPU调度软件:ACM多GPU调度软件,支持交互式作业与排队方式的批处理作业,支持串行与并行作业,提供实时作业状态信息显示,支持系统资源分配与限制
- GPU集群平台软件:提供在线界面用于提交及分发GPU作业,具备权限控制
- 预装软件:NVIDIA Tesla GPU配套应用软件,如CUDA9 SDK等
制造商要求
- 提供NVIDIA认可的Tesla GPU CUDA Driver安装和测试报告
- ISO9001:2008质量管理体系认证
- 具备NVIDIA TPP (Tesla Preferred Provider)推荐供应商资质,五名及以上NVIDIA认证技术工程师和销售工程师资质
- 进行Burn in和function test以确保机器稳定性和散热
- 提供内存测试报告和操作系统稳定性测试报告
保修与测试
- 保修:3年整机产品质保,具备远程机器检测能力
- 测试:5stageQA,至少包括24小时负载99%的耐高温测试,72小时不宕机测试等
注意事项
所有技术要求和质保需在签订合同前提供官方证明。售后响应时间1小时内到达现场。
本文档旨在为用户在选择GPU服务器时提供明确的参考标准,确保服务器能够满足高性能计算的需求。