2018年,NVIDIA发布Kubernetes on Nvidia GPUs(相当于Kubernetes的GPU版),可供开发人员免费使用。该版本是针对那些在多云GPU集群上训练深度学习模型的企业。
背后的想法是为了让软件容器编排平台更加“GPU感知”。帮助开发人员更好地协调散步在多个云主机的GPU集群。
功能:
1. 让Kubernetes能感知到GPU资源(计算单元+显存),用于调度;
2. 可视化和监控GPU各项指标和健康状态;
NVIDIA GPU Cloud (NGC) : 就是一个GPU应用的容器库;