原有服务器状态:
- NVIDIA Titan V显卡
- 390版本的驱动
- cuda9.0
- 与cuda9.0对应的cudnn
- chainer 框架
- pytorch框架
安装过程:
驱动安装
1.下载2080Ti 驱动(本文所用430版本)
2.关闭进入字符终端(ctr+alt+F1),关闭显示服务,命令如下:
sudo service lightdm stop
3.进入驱动文件所在目录,更改权限,使其拥有运行权限:
sudo chmod u+x NVIDIA-Linux-x86_64-430.26.run
4.安装驱动:命令如下:
sudo ./NVIDIA-Linux-x86_64-430.26.run -no-opengl-files
注意,末尾命令必须加“–no-opengl-files”,否则会在登录时进入死循环
5.重启,此时会发现两个卡都可检测到,但是cuda版本必须为10.1,所以必须升级cuda到10.1版本
cuda10.1安装
1.到官网下载cuda10.1的linux系统的runfile文件。
2.进入字符终端(ctr+alt+F1),然后关掉显示程序
sudo service lightdm stop
3.进入到runfile文件所在目录,执行runfile:
sudo sh run_file_name.run
4.Do you accept the previously read EULA ?
accept/decline/quit :accept
Install NVIDIA Accelerated Graphics Driver for linux-x86-64 375.26?
写入accept
5.选中install 回车
6.重启
7.添加环境变量:sudo gedit /etc/profile在文件中末尾加入如下:
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PAT
8.重启
cudnn安装
可参考文献
pytorch 安装
删除原先版本的,可在官网安装cuda10.0版本的
chainer 安装
首先删除原先版本的cupy,安装cupy-cuda10.1