本文转自:丽台科技
NVIDIA驱动的WinFast RTX AI工作站配备了一整套经过测试和优化的数据科学软件,建构于NVIDIA CUDA-X AI之上,拥有超过15个函式库,使现代计算应用程序能够受益于NVIDIA的Quadro RTX GPU加速计算平台。这篇文章将会使用WinFast WS830工作站以及WinFast WS1030工作站搭配NVIDIA QUADRO GPU来测试深度学习的效能。
所有测试皆以TensorFlow 1.12版作为深度学习框架,测试数据使用ImageNet进行深度学习图像处理的效能测试。效能测试分成两大部分,包含单GPU卡和多GPU卡的效益,以提供卡片数量增加时,各项常见AI模型的效能(Images/sec),数字越高表示效能越佳。另外一部分为多GPU卡时,半精度(FP16)及单精度(FP32)效能测试。其目的在于检测RTX GPU系列的硬件Tensor Cores,于实际进行AI模型训练时的效益。也就是说,半精度(FP16)有使用Tensor Cores进行运算,而单精度(FP32)则是使用CUDA Cores进行运算。
软硬件配置