tensorflow 多卡测试_“AI工作站”效能测试大揭秘

本文介绍了使用WinFast RTX AI工作站进行的深度学习效能测试,特别是TensorFlow 1.12在NVIDIA Quadro RTX GPU上的表现。测试显示,增加GPU卡数量能显著提升AI模型的处理速度,尤其是在半精度(FP16)运算中,Tensor Cores能带来60%-95%的效能提升。测试涵盖了QUADRO RTX5000、6000和8000,展示了NVLink在特定模型如AlexNet中的效能增强。
摘要由CSDN通过智能技术生成

本文转自:丽台科技

NVIDIA驱动的WinFast RTX AI工作站配备了一整套经过测试和优化的数据科学软件,建构于NVIDIA CUDA-X AI之上,拥有超过15个函式库,使现代计算应用程序能够受益于NVIDIA的Quadro RTX GPU加速计算平台。这篇文章将会使用WinFast WS830工作站以及WinFast WS1030工作站搭配NVIDIA QUADRO GPU来测试深度学习的效能。

所有测试皆以TensorFlow 1.12版作为深度学习框架,测试数据使用ImageNet进行深度学习图像处理的效能测试。效能测试分成两大部分,包含单GPU卡和多GPU卡的效益,以提供卡片数量增加时,各项常见AI模型的效能(Images/sec),数字越高表示效能越佳。另外一部分为多GPU卡时,半精度(FP16)及单精度(FP32)效能测试。其目的在于检测RTX GPU系列的硬件Tensor Cores,于实际进行AI模型训练时的效益。也就是说,半精度(FP16)有使用Tensor Cores进行运算,而单精度(FP32)则是使用CUDA Cores进行运算。

软硬件配置

2c7f3a4baa145f2f4c2d299f6f0708b7.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值