显卡为 Nvidia Tesla T4
前置
安装gcc编译环境以及内核相关的包
# 添加阿里云的安装源
1 2 3 |
|
# 安装基础环境
1 |
|
# 时间同步
1 |
|
# 重启
1 |
|
# 整体升级
1 |
|
# 再次重启
1 |
|
检查
注意:安装内核包时需要先检查一下当前内核版本是否与所要安装的kernel-devel/kernel-doc/kernel-headers的版本一致,请务必保持两者版本一致,否则后续的编译过程会出问题。
1 2 3 4 5 6 7 8 9 10 11 12 |
|
两种方法可以解决版本不一致的问题:
方法一、升级内核版本,具体升级方法请自行百度, 可以不用设为默认启动内核;
方法二、安装与内核版本一致的kernel-devel/kernel-doc/kernel-headers,例如:
1 |
|
安装显卡驱动
下载
查看支持显卡的驱动最新版本及下载,下载之后是.run后缀。然后上传到服务器任意位置即可
准备
禁用系统默认安装的 nouveau 驱动
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
安装DKMS模块
DKMS全称是DynamicKernel ModuleSupport,它可以帮我们维护内核外的驱动程序,在内核版本变动之后可以自动重新生成新的模块。
1 |
|
安装
执行以下命令进行安装,文件名替换为自己的。
1 2 3 4 |
|
按照安装提示进行安装,一路点yes、ok
安装完之后输入以下命令 ,显示如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
安装CUDA
安装前检查
1、确定已经安装NVIDIA显卡
1 2 |
|
2、确认安装gcc,如果没有安装需要安装
1 2 3 4 5 6 7 |
|
3、禁用Nouveau
1 2 3 4 |
|
4、设置开机启动级别
在加载Nouveau驱动程序或图形界面处于活动状态时,无法安装CUDA驱动程序
1 2 3 |
|
安装
此处的安装环境为离线环境,需要先下载cuda安装文件,安装文件可以去官网地址下载对应的系统版本,官网下载地址:CUDA Toolkit Archive | NVIDIA Developer
CUDA版本按照自己的需求选择即可, 这里我选择的安装类型为 runfile(local)
1 2 |
|
接着,会出现安装界面,输入accept,
第二个界面, 直接选择install
安装后脚本输出, 临时保存一下, 后面需要:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
|
添加CUDA进入环境变量
1 2 3 4 5 6 7 |
|
验证
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 |
|
主要关注 Result = PASS 代表测试通过
安装cuDNN
下载
从官网上(cuDNN Archive | NVIDIA Developer)下载相关版本的CUDNN(需要先注册账号才能下载):
注意:要选择CUDA相对应版本的。
安装
上传并解压
1 2 3 4 5 6 7 8 9 10 11 12 |
|