【深度学习环境配置】Ubuntu(Linux)深度学习环境配置

驱动信息查看

  1. 查看自己的操作系统的内核版本等信息
cat /etc/issue 或者是 cat /etc/lsb-release
  1. 查看显卡的信息
lspci | grep -i nvidia
  1. 如果安装了对应的显卡驱动则可以使用命令
nvidia -smi
  1. 查看安装的显卡的驱动信息
cat /proc/driver/nvidia/version

显卡驱动的安装需要根据操作系统的版本进行选择

gcc || g++

gcc和g++是很多驱动安装过程中需要使用的编译器,很多时候由于编译器版本的不对应出现了很多错误

  1. 查看自己的gcc和g++版本:
gcc --version以及g++ --version
  1. 安装新的或者安装多版本的gcc和g++流程

首先加入一些更新的仓库,以便于更新
sudo add-apt-repository ppa:ubuntu-toolchain-r/test

对需要的软件包等j进行必要的更新
sudo apt-get update以及sudo apt get update

用于安装对应版本的gcc和g++,注意自己需要的版本自己修改
sudo apt-get install gcc-4.9以及sudo apt-get install g++-4.9

这两行用于将刚安装的gcc和g++注册的操作加入到bin中,用于可选择操作。通过这个操作不断向系统注册新的gcc和g++版本
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

update-alternatives --config gcc
update-alternatives --config g++
用于对版本进行选择。进入之后根据提示完成选择j即可,如果权限不够加sudo

在不断改变gcc和g++的版本依然出错的情况下,应该是卸载显卡驱动重装显卡驱动。

驱动安装

  1. 如果需要安装显卡驱动,首先应该将旧版本的显卡驱动卸载:
sudo apt-get remove --purge nvidia*
  1. 在安装之前,需要禁用一个东西——nouveau,即采用如下操作

sudo vim /etc/modprobe.d/blacklist.conf

在文件的最后加入如下内容
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

检查操作是否成功,采用

lsmod | grep nouveau

没显示即成功

  1. 驱动的安装仅需要到官网进行相应的驱动的下载即可(https://www.nvidia.com/Download/index.aspx?lang=cn)( 注意在驱动的下载那里,操作系统的选择直接选择LInux-xbit即可,这个是可以搜索得到的,如果选择ubuntu16等搜不到。亲测直接搜索Linux 64-bit安装有效可用!)

  2. 将下载好的显卡驱动上传到服务器进行安装。

sudo ./NVIDIA-Linux-x86_64-430.34.run

采用该命令进行驱动程序的安装,安装完成后,采用nvidia-smi进行查看

CUDA安装

  1. 进入官网下载对应的CUDA版本,由于上面的操作已经得知了显卡驱动支持的CUDA版本和当前操作系统的版本号,因此可以很容易选择出合适的cuda版本
  2. 按照官网的操作下载cuda,并sudo sh cuda_*.run命令,从而进行安装。
  3. 安装过程中,第一步需要continue(显示管理器仍然开启,时候需要继续),第二步则是accept接受相应的条件,第三步则是去掉第一个安装驱动,即x去掉,下面的都不变
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.1/bin
  1. 安装完成后,但是未配置环境变量,因此输入命令nvcc -V,提示没有找到对应的命令,需要进行环境变量的配置这时候cuda是安装好了,但是环境变量找不到cuda程序,自己手动修改环境变量文件,通过vim或者gedit修改,对应命令分别为vim ~/.bashrc和gedit ~/.bashrc,将下面的内容添加到文件最后,再通过source ~/.bashrc更新环境变量。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
  1. 配置完成后,输入nvcc -V检查是否安装成功。
  2. 但是在之后运行develop的python环境时,遇到了问题

fatal error: cuda_runtime_api.h: No such file or directory

这其实是没有找到cuda地址(https://github.com/HawkAaron/warp-transducer/issues/15),因此可以通过 CUDA_HOME=/usr/local/cuda来进行声明

  1. 多版本的cuda管理,在/usr/local中存在cuda一个文件以及cuda-10.1等不同的版本cuda,而cuda是软连接到了安装的真正的cuda-10.0的地址,因此软连接的建立可以用于多个cuda版本的管理,只需要修改软连接就可以修改cuda的版本,而环境变量是指向的软连接,因此可以直接修改软连接即可。即删除旧的软连接再建立新的软连接方式来实现不同版本的cuda的切换。
sudo rm -rf cuda # 删除旧版本的软连接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda  # 建立新版本的软连接,前面的路径是需要的版本的cuda的安装路径。

CUDNN安装

一般来说,对于深度学习的环境配置,只需要通过conda命令安装pytorch,就会自动下载cudnn,因此暂时不需要安装CUDNN

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值