阿里云 GPU 云服务器 TensorFlow 单机多卡训练性能实践
4 性能实测
我们在阿里云上的 GN5 GPU 云服务器(8 卡 P100)上使用 TensorFlow 测试了 InceptionV3、ResNet50、ResNet152、AlexNet、VGG16 几个经典卷积神经网络的用于图像分类模型的训练性能,并使用不同的策略做了比较,具体实测数据如下。
4.1 InceptionV3
Parameter Server(CPU):
Parameter Server(GPU):
Replicated(NCCL):
Replicated(NONE):
Replicated(PSCPU):
4.2 ResNet50
Parameter Server(CPU):
Parameter Server(GPU):
Replicated(NCCL):
Replicated(NONE):
Replicated(PSC