因为GPU服务器初始化会安装低版本的GPU驱动 396.**和CUDA 8.**
在测试T4 GPU服务器时不能正确识别到T4 GPU卡,需要安装支持T4卡的驱动和升级CUDA版本,下面为步骤:
1.download安装包
cd /tmp
2.卸载原有的旧版本驱动和CUDA
To remove CUDA Toolkit:
yum remove "*cublas*" "cuda*"
To remove NVIDIA Drivers:
yum remove "*nvidia*"
3.安装新版本驱动+CUDA
安装驱动需要依赖vulkan-filesystem
yum install vulkan-filesystem
如果yum源中没有这个包可以通过下面的方式下载安装
wget https://houzhibo.com/wp-content/uploads/2019/05/vulkan-filesystem-1.1.73.0-1.el7_.noarch.rpm_.zip
unzip vulkan-filesystem-1.1.73.0-1.el7_.noarch.rpm_.zip
rpm -ivh vulkan-filesystem-1.1.73.0-1.el7.noarch.rpm
sudo yum clean all
sudo yum install cuda
nvidia-smi 检测GPU是否被识别。