2020年6月15日,业界应用最为广泛的Kubernetes管理平台创建者Rancher Labs(以下简称Rancher)宣布与初创公司趋动科技 (VirtAITech.com) 达成深度战略合作,推动GPU资源池化在Kubernetes中落地。
Rancher的旗舰产品Rancher 2.x 是一款核心镜像下载量超3亿、拥有逾40,000家企业用户的企业级Kubernetes管理平台。Kubernetes的发展如日中天,越来越多的用户将AI计算平台搬到Kubernetes上,如何让工作负载更灵活地使用GPU资源成为了企业的核心诉求,Rancher与趋动科技的合作完美解决了这一核心问题。
趋动科技由多位具有世界500强中国研究院负责人背景并且具有共同远大理想的高科技人才创立,专注于为全球用户提供国际领先的数据中心级AI加速器资源池化和虚拟化软件及解决方案。其旗下主要产品OrionX GPU资源池化解决方案(猎户座GPU资源池化解决方案)可以在几乎零性能损失的情况下,提供对于物理GPU的细粒度、可远程、运行时动态可配置的虚拟化方案。通过高效的通讯机制,使得AI应用、CUDA应用可以运行在云或者数据中心内任何一个物理机、容器或者VM内,而无需挂载物理GPU,同时为这些应用程序提供在GPU资源池中的硬件算力。
解决K8S的GPU管理挑战
Kubernetes现已成为容器编排调度的事实标准,但在开源生态中,Kubernetes使用GPU资源一直存在诸多限制,比如仅能使用整数数量的GPU卡资源、Pod无法共享GPU卡、无法远程调用GPU卡等。面对Kubernetes使用GPU资源的众多难题,Rancher与趋动科技共同推出了面向Kubernetes的GPU资源池化联合解决方案。Rancher可以同时管理多个Kubernetes集群,用户可以通过其内置的应用市场Catalog开箱即用地将OrionX部署至各个业务集群,OrionX具备专业的GPU池化和虚拟化功能,可以无侵入地整合至Rancher托管的Kubernetes集群当中。最终,用户可以极为方便地在Rancher平台上进行GPU资源调度,从而让工作负载使用OrionX提供的vGPU资源。
简单易部署,一键开箱试用
OrionX现已集成至Rancher中国的应用市场当中,开源用户可以通过导入pandaria-catalog(https://github.com/cnrancher/pandaria-catalog)获取这一应用,企业用户无需导入即可轻松使用。除此之外,用户还可以申请OrionX试用License,通过RancherUI一键部署OrionX,OrionX可以部署在私有云或公有云上,并对GPU资源进行池化切分,让Pod共享GPU资源,进一步提升GPU资源的使用效率。
面向生产环境,企业级落地
企业级场景对GPU资源池具有更高的管理需求,因此需要更为专业的解决方案。在Rancher与OrionX的联合解决方案中,除了对计算节点GPU资源切分外,还支持GPU远程调用和多GPU聚合等功能。远程调用如同“隔空取物”,让计算平台和GPU资源池完全解耦,更加有利于企业用户的运维部署和管理。多GPU聚合如同“化零为整”,用户可以将多台物理服务器上的GPU资源提供给单个Pod使用,无需修改用户AI应用程序代码。
加速AI创新与K8S落地
随着容器技术不断成熟发展,其细分领域逐渐开枝散叶,AI计算的容器化也是Kubernete众多发展方向的亮点之一。AI计算与容器化离不开Kubernetes对GPU的管理,以各种粒度切分并灵活管理GPU资源是企业对容器平台的普遍需求。Rancher提供多样而稳定的面向多云环境的Kubernetes平台,OrionX则提供专业的Kuebrnetes GPU资源池化功能,Rancher与趋动科技OrionX的合作让GPU资源管理变得愈发简单易用,助力企业更加高效地管理AI计算的基础设施。
据悉,在本次推出联合解决方案后,双方还将继续在边缘计算领域开展更为深入的合作。在Rancher的“Software-Defined Edge(软件定义边缘)”边缘计算解决方案中,OrionX将整合轻量级K8S发行版与K3S,为用户提供边缘侧的轻量级GPU虚拟化方案。
“Rancher对容器和Kubernetes的设计理念和实际运用是业界领先的。”趋动科技创始人及CEO王鲲博士称赞道:“趋动科技的OrionX资源池化与Rancher 2.x的联合解决方案为用户提供了更大的价值和更加灵动的任务处理能力,加速推动AI计算与Kubernetes的发展及落地。”
“GPU虚拟化是推动Kubernetes落地AI场景的关键举措,我们非常高兴可以和趋动科技一起首创推出在这一领域的联合解决方案。”Rancher中国CEO秦小康总结道:“未来,Rancher将与趋动科技紧密合作,为用户提供从数据中心、云端到边缘侧的轻量级GPU虚拟化方案,最终为企业提供基于Kubernetes的计算力管理,推动计算无处不在。“