基于国产加速器海光DCU&GPGPU的k8s插件dcu-device-plugin安装V2.0.0

目录

一、简介

二、基础软硬件环境

2.1 硬件环境

2.2 软件环境

2.3 插件列表

三、DCU设备插件部署

3.1 部署DCU-Exporter

3.1.1 物理机部署

3.1.2 Docker 容器部署

3.1.3 Kubernetes 集群部署

3.2 部署DCU-Device-Plugin

3.3 部署 promethus

3.4  检查组件运行情况

3.5  设备Metrics 说明

四、DCU设备调用


一、简介

本文主要针对国产加速器海光DCU 设备插件的安装与初步使用测试进行介绍,包括物理机、容器环境与Kubernetes 集群环境下DCU 设备的调用和监控。

二、基础软硬件环境

2.1 硬件环境

  •  需要宿主机安装配置了DCU

2.2 软件环境

  • 需要保证Kubernetes 集群版本在1.18 及以上;
  • 需要在宿主机安装DCU 驱动程序,可以在光合开发者社区下载:

https://cancon.hpccube.com:65024/6/main

  • 需要在光合开发者社区下载Kubernetes 插件:

https://cancon.hpccube.com:65024/5/main

2.3 插件列表

三、DCU设备插件部署

3.1 部署DCU-Exporter

 DCU-Exporter 现支持物理机部署、docker 容器部署、Kubernetes 集群部署三种方式。

3.1.1 物理机部署

前置条件:

  • 在安装DCU 的节点上,安装dtk 并使环境变量生效(推荐方法);
  • 或者将目标主机操作系统对应dtk 的dtk/rocm_smi/lib 目录下librocm_smi64.so.2.8

动态链接库放置到目标主机/usr/lib64 目录下, 并在/usr/lib64 目录创建指向
librocm_smi64.so.2.8 的软链接librocm_smi64.so.2 和指向librocm_smi64.so.2 的软链
接librocm_smi64.so。
dcu-exporter 启动直接运行可执行文件dcu-exporter-v2,dcu-exporter-v2 支持启动参数
和环境变量两种方式指定exporter 服务端口。启动时添加-port 参数指定端口,环境变量
DCU_EXPORTER_LISTEN 也可指定服务端口。优先启动参数指定,其次环境变量指定,最后默
认16080。

./dcu-exporter-v2 -port=16080

 使用curl 命令来查看指标:

curl localhost:16080/metrics

看到如下的输出示例,显示了DCU 内存规格、温度等信息:

# HELP dcu_memorycap_bytes dcu metrics of gauge
# TYPE dcu_memorycap_bytes gauge
dcu_memorycap_bytes{device_id="T8R1380013061601",minor_number="0",name="",no
de="dcunode3",pcieBus_number="0000:f6:00.0"} 3.4342961152e+10
dcu_memorycap_bytes{device_id="T8R1380019021101",minor_number="1",name="",no
de="dcunode3",pcieBus_number="0000:6a:00.0"} 3.4342961152e+10
# HELP dcu_temp dcu metrics of gauge
# TYPE dcu_temp gauge
dcu_temp{device_id="T8R1380013061601",minor_number="0",name="",node="dcunode
3",pcieBus_number="0000:f6:00.0"} 46
dcu_temp{de
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

技术瘾君子1573

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值