- 博客(3)
- 收藏
- 关注
原创 零基础入门昇腾集群调度组件NPU Exporter
在计算任务运行过程中,除芯片故障外,往往需要关注芯片的网络和算力使用情况,以便确认任务运行过程中的性能瓶颈,找到提升任务性能的方向。MindCluster提供了部署在计算节点的NPU Exporter组件,用于上报从驱动中获取到的芯片、网络的各项数据信息。
2026-02-27 11:01:20
565
原创 零基础入门昇腾集群调度组件Ascend Docker Runtime
创建容器时,为了容器内部能够正常使用昇腾AI处理器,需要引入昇腾驱动相关的脚本和命令。这些脚本和命令分布在不同的文件中,且存在变更的可能性。为了避免容器创建时冗长的文件挂载,MindCluster提供了部署在计算节点上的Ascend Docker Runtime组件。通过输入需要挂载的昇腾AI处理器编号,即可完成昇腾AI处理器及相关驱动的文件挂载。
2026-02-26 16:57:18
630
原创 零基础入门昇腾集群调度组件Ascend Device Plugin
K8s对资源信息的调度依赖感知的资源信息。除基础的CPU和内存信息以外,需通过K8s提供的设备插件机制,供用户自定义新的资源类型,从而定制个性化的资源发现和上报策略。MindCluster提供了部署在计算节点的Ascend Device Plugin服务,用于提供适合昇腾设备的资源发现和上报策略。
2026-02-26 16:49:43
611
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅