OpenStack案例研究:Graphcore

Graphcore的先进人工智能计算系统为云中和内部部署的机器智能工作负载提供了领先的性能。每个Graphcore系统的核心是智能处理单元(IPU),这是一款专为人工智能处理器设计的处理器,旨在满足先进人工智能的独特计算要求。

Graphcore技术被商业和公共部门客户以及私营和学术研究机构用于实现新的人工智能突破并加速大规模部署。

2021年,Graphcore采用OpenStack作为他们构建平台服务和整个云的参考平台。本文让你进一步了解OpenStack如何使他们能够创建用于运行人工智能机器学习工作负载的基础设施。

OpenStack是如何改变组织的?

Graphcore的硬件架构具有独特的灵活性,是为机器学习从头开始构建的。使用传统的部署方法,在技术上可以构建我们灵活的网络架构,但这将非常耗时,并且不允许租户或使用模型的快速更改。

使用基础设施即代码(主要是Terraform)against OpenStack API,可以在各个级别快速重新配置,包括通过SRIOV的RDMA,这对IPU产品的功能至关重要。

在OpenStack上运行的工作负载是什么?

我们使用OpenStack创建基础设施,用于运行人工智能和机器学习工作负载。我们使用定制芯片和最快的网络接口和设备创建人工智能处理产品。这些都需要最具创新性和优化的基础设施来实现高效利用。最大限度地提高每一点的数据入口和处理带宽对于保持人工智能的活力至关重要。

OpenStack环境的规模是多少?

我们目前有多个环境,包括两个生产云,每个云至少包含64个高核心数服务器和1024个IPU,用于工作负载、400Gb网络、超融合Ceph部署以及八个控制平面和存储服务器。

OpenStack环境还集成了哪些开源技术?

我们的OpenStack部署在很大程度上依赖于Terraform、ansible、Kubernetes、Azimuth和AWX。

Graphcore和StackHPC扩展了OpenStack功能,使IPU Machine成为一流的公民(通过Ironic),并继续通过Blazar开发全面的资源管理。

原文链接:

https://superuser.openinfra.dev/articles/graphcore-an-openstack-case-study/

e311395cfe3f415cbab248cae5bccf16.jpeg

b26f363c8ca86627ca50ab9ebf988d52.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值