ubuntu18.04下cuda和cudnn的安装及一些自己遇到的问题

@ubuntu18.04下cuda和cudnn的安装及一些自己遇到的问题
如果要安装cuda cudnn在虚拟环境先

创建虚拟环境

           conda create -n my_env_name python3.7

激活环境

           source activate my_env_name

检查cuda,看看原来装没装

nvcc --version
或者nvcc -V
或者cat /usr/local/cuda/version.txt
若nvcc指令无法识别,先安装nvidia-cuda-tools:

sudo apt install nvidia-cuda-toolkit(这里是直接要安装cuda)

bug

如果是重装了一下cuda,然后发现nvcc命令不存在了,终端提示使用 : sudo apt-get install nvidia-cuda-toolkit 。
注意不要使用这种方式安装。系统认为你没有安装cuda,实际上你已经装了。执行这条命令会重新安装cuda。

正确操作:
进入:cd /usr/local/cuda
查看cuda的bin目录下是否有nvcc,
有的话直接将cuda路径加入系统路径就可以了
可以写入~/bashrc里面

export PATH=/usr/local/cuda-10.2/bin: P A T H e x p o r t L D L I B R A R Y P A T H = / u s r / l o c a l / c u d a − 10.2 / l i b 64 : PATH export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64: PATHexportLDLIBRARYPATH=/usr/local/cuda10.2/lib64:LD_LIBRARY_PATH

然后:source ~/.bashrc

查看可使用驱动

 ubuntu-drivers devices

1.更新一下apt

sudo apt-get update

2安装驱动或更新驱动

ubuntu-drivers devices查看可用驱动
检查驱动中 后面有recommended的是可以系统推荐的驱动

自动安装推荐驱动
sudo ubuntu-drivers autoinstall

或者也可以自己去官网
下载
https://www.nvidia.com/Download/index.aspx#
安装
sudo apt-get install nvidia-某某某

安装完成后别忘记重启一下

bug

我安装后    nvidia-smi和nvcc -V  的版本不一样
查到smi是driver     nvcc是runtime     两个版本要对应起来,deb好像是可以一起安装,我是分开安装的。
后来把nvcc的cuda卸载了重装,可能是以前的。

查看Gpu信息

nvidia-smi

3CUDA官网下载

nvidia官网下载地址: https://developer.nvidia.com/cuda-10.2-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal.

建议使用local下载
我用deb老出现bug

bug又来了

[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc

[INFO]: gcc version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.12)

[INFO]: Initializing menu
[INFO]: Setup complete
[INFO]: Components to install:
[INFO]: Driver
[INFO]: 440.33.01
[INFO]: Executing NVIDIA-Linux-x86_64-440.33.01.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd  2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 440.33.01 failed, quitting

4安装

删除原有cuda
sudo apt autoremove cuda

若上一步删不干净,接着使用:
sudo apt --purge remove “cublas” “cuda*”

在 之前的下载的文件目录下运行:
sudo sh cuda_10.2.89_440.33.01_linux.run

1.continue
2.把Driver的×取消,install
添加环境

vim .bashrc

文末添加
export PATH="/usr/local/cuda-10.2/bin: P A T H " e x p o r t L D L I B R A R Y P A T H = " / u s r / l c o a l / c u d a − 10.2 / l i b 64 : PATH" export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.2/lib64: PATH"exportLDLIBRARYPATH="/usr/lcoal/cuda10.2/lib64:LD_LIBRARY_PATH"
最后使其生效
source ~/.bashrc

测试是否安装成功
打开目录
$ cd /usr/local/cuda-10.2/samples/1_Utilities/deviceQuery
编译
$ sudo make
测试
$ ./deviceQuery
Pass则成功

##bug
/tmp 内存不够并且安装包不对
解决:
新建文件夹opt/tmp
安装时把Driver的×取消?
忘记怎么产生这个bug和怎么解决了

下载cudnn

【下载】
https://developer.nvidia.com/rdp/cudnn-download
找自己版本的下载
cuDNN Runtime Library for Ubuntu18.04 (Deb)
cuDNN Developer Library for Ubuntu18.04 (Deb)
cuDNN Code Samples and User Guide for Ubuntu18.04 (Deb)

安装
$ sudo dpkg -i libcudnn7_7.6.4.38-1+cuda10.2_amd64.deb
$ sudo dpkg -i libcudnn7-dev_7.6.4.38-1+cuda10.2_amd64.deb
$ sudo dpkg -i libcudnn7-doc_7.6.4.38-1+cuda10.2_amd64.deb
对应着自己版本名 测试是否安装成功
cp -r /usr/src/cudnn_samples_v7 /$HOME
$ cd $HOME/cudnn_samples_v7/mnistCUDNN/
$ make all
$ ./mnistCUDNN
pass就是成了

查版本

V5以后的版本要用这个查版本
cat /usr/include/x86_64-linux-gnu/cudnn_v*.h | grep CUDNN_MAJOR -A 2

显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn区别?
https://cloud.tencent.com/developer/article/1536738

etc/default/grub
boot/grub/grub.cfg调用上面的文件进行引导中的配置更新

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值