背景:由于项目需要使用pytorch1.5,因此安装时需要安装CUDA10.2版本。但原服务器上为CUDA8.0版本。由此需要更新版本、
1、CUDA安装包下载
直接官网下载,选择自己机子的版本。
https://developer.nvidia.com/cuda-10.2-download-archive?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=runfilelocal
得到文件
运行run文件进行安装。
sudo sh cuda_10.2.89_440.33.01_linux.run
可能遇到的问题:
问题1:there is enough space in /tmp and that the installation package is not corrupt
解决:添加一个空间够的临时文件目录,比如先在用户目录下创建一个tmp目录,运行run文件时再指定路径。
mkdir /home/***/tmp
sudo sh cuda_10.2.89_440.33.01_linux.run --tmpdir=/home/****/tmp
问题2:Installation failed. See log at /var/log/cuda-installer.log for details.
查看错误vim /var/log/cuda-installer.log
出现以下错误
[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /bin/gcc
[INFO]: gcc version: gcc version 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC)
[INFO]: Initializing menu
[INFO]: Setup complete
[INFO]: Components to install:
[INFO]: Driver
[INFO]: 440.33.01
[INFO]: Executing NVIDIA-Linux-x86_64-440.33.01.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd 2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 440.33.01 failed, quitting
这个问题是显卡驱动问题
解法方法见https://blog.csdn.net/qq_29477893/article/details/116795004
2、安装
驱动解决完后回来继续安装。
1、sudo sh cuda_10.2.89_440.33.01_linux.run --tmpdir=/home/****/tmp
2、键入accept
3、选取要安装的工具,这里不用安装驱动了
4、如果之前没CUDA其他版本则yes,如果有其他版本想要多版本共存则no
5.查看usr/local下,则有这三个目录
3、多版本CUDA共存
https://blog.csdn.net/Mr__George/article/details/106984574