@ubuntu18.04下cuda和cudnn的安装及一些自己遇到的问题
如果要安装cuda cudnn在虚拟环境先
创建虚拟环境
conda create -n my_env_name python3.7
激活环境
source activate my_env_name
检查cuda,看看原来装没装
nvcc --version
或者nvcc -V
或者cat /usr/local/cuda/version.txt
若nvcc指令无法识别,先安装nvidia-cuda-tools:
sudo apt install nvidia-cuda-toolkit(这里是直接要安装cuda)
bug
如果是重装了一下cuda,然后发现nvcc命令不存在了,终端提示使用 : sudo apt-get install nvidia-cuda-toolkit 。
注意不要使用这种方式安装。系统认为你没有安装cuda,实际上你已经装了。执行这条命令会重新安装cuda。
正确操作:
进入:cd /usr/local/cuda
查看cuda的bin目录下是否有nvcc,
有的话直接将cuda路径加入系统路径就可以了
可以写入~/bashrc里面
export PATH=/usr/local/cuda-10.2/bin: P A T H e x p o r t L D L I B R A R Y P A T H = / u s r / l o c a l / c u d a − 10.2 / l i b 64 : PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64: PATHexportLDLIBRARYPATH=/usr/local/cuda−10.2/lib64:LD_LIBRARY_PATH
然后:source ~/.bashrc
查看可使用驱动
ubuntu-drivers devices
1.更新一下apt
sudo apt-get update
2安装驱动或更新驱动
ubuntu-drivers devices查看可用驱动
检查驱动中 后面有recommended的是可以系统推荐的驱动
自动安装推荐驱动
sudo ubuntu-drivers autoinstall
或者也可以自己去官网
下载
https://www.nvidia.com/Download/index.aspx#
安装
sudo apt-get install nvidia-某某某
安装完成后别忘记重启一下
bug
我安装后 nvidia-smi和nvcc -V 的版本不一样
查到smi是driver nvcc是runtime 两个版本要对应起来,deb好像是可以一起安装,我是分开安装的。
后来把nvcc的cuda卸载了重装,可能是以前的。
查看Gpu信息
nvidia-smi
3CUDA官网下载
建议使用local下载
我用deb老出现bug
bug又来了
[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc
[INFO]: gcc version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.12)
[INFO]: Initializing menu
[INFO]: Setup complete
[INFO]: Components to install:
[INFO]: Driver
[INFO]: 440.33.01
[INFO]: Executing NVIDIA-Linux-x86_64-440.33.01.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd 2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 440.33.01 failed, quitting
4安装
删除原有cuda
sudo apt autoremove cuda
若上一步删不干净,接着使用:
sudo apt --purge remove “cublas” “cuda*”
在 之前的下载的文件目录下运行:
sudo sh cuda_10.2.89_440.33.01_linux.run
1.continue
2.把Driver的×取消,install
添加环境
vim .bashrc
文末添加
export PATH="/usr/local/cuda-10.2/bin:
P
A
T
H
"
e
x
p
o
r
t
L
D
L
I
B
R
A
R
Y
P
A
T
H
=
"
/
u
s
r
/
l
c
o
a
l
/
c
u
d
a
−
10.2
/
l
i
b
64
:
PATH" export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.2/lib64:
PATH"exportLDLIBRARYPATH="/usr/lcoal/cuda−10.2/lib64:LD_LIBRARY_PATH"
最后使其生效
source ~/.bashrc
测试是否安装成功
打开目录
$ cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
编译
$ sudo make
测试
$ ./deviceQuery
Pass则成功
##bug
/tmp 内存不够并且安装包不对
解决:
新建文件夹opt/tmp
安装时把Driver的×取消?
忘记怎么产生这个bug和怎么解决了
下载cudnn
【下载】
https://developer.nvidia.com/rdp/cudnn-download
找自己版本的下载
cuDNN Runtime Library for Ubuntu18.04 (Deb)
cuDNN Developer Library for Ubuntu18.04 (Deb)
cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)
安装
$ sudo dpkg -i libcudnn7_7.6.4.38-1+cuda10.2_amd64.deb
$ sudo dpkg -i libcudnn7-dev_7.6.4.38-1+cuda10.2_amd64.deb
$ sudo dpkg -i libcudnn7-doc_7.6.4.38-1+cuda10.2_amd64.deb
对应着自己版本名 测试是否安装成功
cp -r /usr/src/cudnn_samples_v7 /$HOME
$ cd $HOME/cudnn_samples_v7/mnistCUDNN/
$ make all
$ ./mnistCUDNN
pass就是成了
查版本
V5以后的版本要用这个查版本
cat /usr/include/x86_64-linux-gnu/cudnn_v*.h | grep CUDNN_MAJOR -A 2
显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn区别?
https://cloud.tencent.com/developer/article/1536738
etc/default/grub
boot/grub/grub.cfg调用上面的文件进行引导中的配置更新