在Kubernetes配置与集群监控的搭建和Docker常用命令中,我们介绍了如何安装Docker以及Kubernetes。对于集群而言,本文将更进一步地介绍如何使用Docker+K8s进行集群的GPU管理。
安装Nvidia驱动
Nvidia的驱动可以在官网下载。注意自己的系统内核以及显卡型号。安装完成后,在命令行使用nvidia-smi
命令来查看显卡列表以及相关信息。如果成功安装,将会看到如下的结果。
~$ nvidia-smi
Sat Nov 13 22:21:26 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.57.02 Driver Version: 470.57.02 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+=========