- 博客(3)
- 收藏
- 关注
原创 Horovod——TensorBox分布式训练实践
Horovod——TensorBox分布式训练实践Reference环境配置——Tensorflow in docker(单机版测试):Import horovod.tensorflow as hvd——horovod单机测试horovod多机器测试——三台、每台一个GPUReferenceHorovod github_homepageHorovod示例代码TensorBox_githu...
2019-02-27 17:57:05 1611
原创 Horovod——分布式深度学习框架使用说明
Horovod——分布式深度学习框架使用说明References:Training 训练过程Horovod_Demmo_tensorflowHorovod_Demmo_MXNetHorovod_Demmo_PytorchInference 推理过程(only forward process)Tensor Fusion: 描述horovod计算和通信特征References:Horovod g...
2019-02-27 15:16:27 12646
原创 Horovod——Uber分布式深度学习框架部署实践
Horovod——Uber分布式深度学习框架部署实践References:部署实践——Horovod in docker:测试环境:## Ubuntu系统安装——bios设置:显卡驱动:系统版本支持及环境包配置:部署docker环境:通过配置DockerFile, 在线下载并部署horovod环境:Nvidia-docker2.0安装:多机器root_ssh配置:Horovod测试:Running...
2019-02-27 14:10:49 4180 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人