Rancher搭建K8S集群并配置GPU共享完整流程

FENGYU406

已于 2022-07-13 08:44:14 修改

阅读量3.2k

点赞数 1

分类专栏： Docker Rancher 文章标签： Docker K8S Rancher GPU共享

于 2021-09-30 14:38:23 首次发布

本文链接：https://blog.csdn.net/u012751272/article/details/120566298

版权

Docker 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

Rancher

3 篇文章 0 订阅

订阅专栏

本文所有内容均搬运自个人博客站 javafeng ,本文中所有有问题的部分请到源站查看

声明

本文所有内容基于Docker，k8s集群由rancher提供工具搭建，GPU共享技术采用了阿里GPU Sharing。使用了其他容器技术的本文不一定适用，或者使用了kubeadm进行k8s搭建的可能有部分不适用，kubeadm搭建的k8s在部署GPU Sharing时网上可查的资料和官网资料都很多，而rancher版本的k8s和原生kubernetes有所差别，后面会夹带一些具体说明。

安装docker和nvidia-docker2

安装Docker，直接执行官方安装脚本安装：

curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

安装完成后，使用Docker version查看版本，目前安装的话一般为20.10版本，能成功查询版本说明安装成功。

安装之后，执行以下命令设置docker自启动：

systemctl start docker
systemctl enable docker

nvidia-docker2安装参见上一篇文章《Ubuntu实现K8S调度NVIDIA GPU小记》安装nvidia-docker安装部分。
在安装完之后，我们需要修改docker默认的运行时，使其支持nvidia的调度，编辑/etc/docker/daemon.json配置（不存在则新建）：

{
    "runtimes": {
        "nvidia": {
            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    },
    "default-runtime": "nvidia",
    "exec-opts": ["native.cgroupdriver=systemd"]
}

其中：runtimes参数是定义运行时，这里定义了一个名为nvidia的运行时环境，default-runtime表示指定默认的运行时为刚刚定义的nvidia。

最后一句"exec-opts": ["native.cgroupdriver=systemd"]的作用是，因为K8S的文件驱动为cgroupfs，而docker的文件驱动为systemd，两者不同会导致镜像无法启动，因此需要将K8S文件驱动也指定为systemd。

GPU驱动

GPU驱动安装和简单调度参见本站上一篇文章《Ubuntu实现K8S调度NVIDIA GPU小记》英伟达驱动部分。

K8S集群搭建

K8S集群搭建部分参见本站《Rancher安装以及创建K8S集群》，搭建完成后，将config文件保存至主机的~/.kube/config；

之后，安装kubectl来管理集群：

curl -LO "https://storage.googleapis.com/kubernetes-release/release/$(curl -s https://storage.googleapis.com/kubernetes-release/release/stable.txt)/bin/linux/amd64/kubectl"
# 配置kubectl
chmod 755 ./kubectl
mv ./kubectl /usr/local/bin/kubectl
# 查看版本
kubectl version

使用kubectl查看pod：

# 查看pod
kubectl get pods

GPU Sharing部署

我们从github上获取scheduler-policy-config.json，放到主机/etc/kubernetes/ssl/下，如果有多个master节点，则每个master节点都需要执行：

cd /etc/kubernetes/ssl/
curl -O https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/config/scheduler-policy-config.json

部署GPU共享调度插件gpushare-schd-extender：

cd /tmp/
curl -O https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/config/gpushare-schd-extender.yaml
# 因为是使用单节点，因此需要能够在master上进行调度，所以需要在gpushare-schd-extender.yaml中将
# nodeSelector:
#    node-role.kubernetes.io/master: ""
# 这两句删除，使k8s能够在master上进行调度
kubectl create -f gpushare-schd-extender.yaml

部署设备插件gpushare-device-plugin

如果你的集群不是新搭建的，之前如果已经安装了nvidia-device-plugin，需要将其删除，rancher版本的k8s可以使用kubectl get pods看到nvidia-device-plugin相应的pod，删除即可。然后部署设备插件gpushare-device-plugin：

cd /tmp/
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-rbac.yaml
kubectl create -f device-plugin-rbac.yaml
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-device-plugin/master/device-plugin-ds.yaml
# 默认情况下，GPU显存以GiB为单位，若需要使用MiB为单位，需要在这个文件中，将--memory-unit=GiB修改为--memory-unit=MiB
kubectl create -f device-plugin-ds.yaml

为GPU节点打标签

为了将GPU程序调度到带有GPU的服务器，需要给服务打标签gpushare=true:

# 查看所有节点
kubectl get nodes
# 选取GPU节点打标
kubectl label node <target_node> gpushare=true
# 例如我这里主机名为master，则打标语句为：
# kubectl label node master gpushare=true

更新kubectl可执行程序：

wget https://github.com/AliyunContainerService/gpushare-device-plugin/releases/download/v0.3.0/kubectl-inspect-gpushare
chmod u+x kubectl-inspect-gpushare
mv kubectl-inspect-gpushare /usr/local/bin

然后执行kubectl inspect gpushare，若能看到GPU信息，则代表安装成功：

GPU信息

可以看到，此时GPU显存总数为7981MiB，使用为0。

测试

接下来进行测试，我们获取阿里云的示例程序：

wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/samples/1.yaml
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/samples/2.yaml
wget https://raw.githubusercontent.com/AliyunContainerService/gpushare-scheduler-extender/master/samples/3.yaml

这四个文件分别是四个需要调度GPU的示例容器的yaml，直接使用kubectl create -f x.yaml启动即可，这些文件中调度的GPU都是以G为单位的，这里我修改了调度数值，调度数值的参数名为：aliyun.com/gpu-mem，第一个为128，第二个是256，第三个是512，逐个启动，观察GPU占用率：
启动第一个：

启动第二个：

启动第三个：