tensorflow 多卡测试_“AI工作站”效能测试大揭秘

最新推荐文章于 2022-08-02 11:07:55 发布

强恒13468511887

最新推荐文章于 2022-08-02 11:07:55 发布

阅读量424

点赞数

文章标签： tensorflow 多卡测试

本文链接：https://blog.csdn.net/weixin_32145807/article/details/112516946

版权

本文介绍了使用WinFast RTX AI工作站进行的深度学习效能测试，特别是TensorFlow 1.12在NVIDIA Quadro RTX GPU上的表现。测试显示，增加GPU卡数量能显著提升AI模型的处理速度，尤其是在半精度(FP16)运算中，Tensor Cores能带来60%-95%的效能提升。测试涵盖了QUADRO RTX5000、6000和8000，展示了NVLink在特定模型如AlexNet中的效能增强。

摘要由CSDN通过智能技术生成

本文转自：丽台科技

NVIDIA驱动的WinFast RTX AI工作站配备了一整套经过测试和优化的数据科学软件，建构于NVIDIA CUDA-X AI之上，拥有超过15个函式库，使现代计算应用程序能够受益于NVIDIA的Quadro RTX GPU加速计算平台。这篇文章将会使用WinFast WS830工作站以及WinFast WS1030工作站搭配NVIDIA QUADRO GPU来测试深度学习的效能。

所有测试皆以TensorFlow 1.12版作为深度学习框架，测试数据使用ImageNet进行深度学习图像处理的效能测试。效能测试分成两大部分，包含单GPU卡和多GPU卡的效益，以提供卡片数量增加时，各项常见AI模型的效能(Images/sec)，数字越高表示效能越佳。另外一部分为多GPU卡时，半精度(FP16)及单精度(FP32)效能测试。其目的在于检测RTX GPU系列的硬件Tensor Cores，于实际进行AI模型训练时的效益。也就是说，半精度(FP16)有使用Tensor Cores进行运算，而单精度(FP32)则是使用CUDA Cores进行运算。

软硬件配置