【深度学习环境配置】Ubuntu（Linux）深度学习环境配置

最新推荐文章于 2024-07-29 21:20:50 发布

「已注销」

最新推荐文章于 2024-07-29 21:20:50 发布

阅读量422

点赞数

分类专栏：深度学习文章标签： linux 深度学习环境配置 Ubuntu CUDA

本文链接：https://blog.csdn.net/weixin_41729258/article/details/112303606

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

环境配置

驱动信息查看

查看自己的操作系统的内核版本等信息

cat /etc/issue 或者是 cat /etc/lsb-release

查看显卡的信息

lspci | grep -i nvidia

如果安装了对应的显卡驱动则可以使用命令

nvidia -smi

查看安装的显卡的驱动信息

cat /proc/driver/nvidia/version

显卡驱动的安装需要根据操作系统的版本进行选择

gcc || g++

gcc和g++是很多驱动安装过程中需要使用的编译器，很多时候由于编译器版本的不对应出现了很多错误

查看自己的gcc和g++版本：

gcc --version以及g++ --version

安装新的或者安装多版本的gcc和g++流程

首先加入一些更新的仓库，以便于更新
sudo add-apt-repository ppa:ubuntu-toolchain-r/test

对需要的软件包等j进行必要的更新
sudo apt-get update以及sudo apt get update

用于安装对应版本的gcc和g++，注意自己需要的版本自己修改
sudo apt-get install gcc-4.9以及sudo apt-get install g++-4.9

这两行用于将刚安装的gcc和g++注册的操作加入到bin中，用于可选择操作。通过这个操作不断向系统注册新的gcc和g++版本
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

update-alternatives --config gcc
update-alternatives --config g++
用于对版本进行选择。进入之后根据提示完成选择j即可，如果权限不够加sudo

在不断改变gcc和g++的版本依然出错的情况下，应该是卸载显卡驱动重装显卡驱动。

驱动安装

如果需要安装显卡驱动，首先应该将旧版本的显卡驱动卸载：

sudo apt-get remove --purge nvidia*

在安装之前，需要禁用一个东西——nouveau，即采用如下操作

sudo vim /etc/modprobe.d/blacklist.conf

在文件的最后加入如下内容
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

检查操作是否成功，采用

lsmod | grep nouveau

没显示即成功

驱动的安装仅需要到官网进行相应的驱动的下载即可（https://www.nvidia.com/Download/index.aspx?lang=cn）（注意在驱动的下载那里，操作系统的选择直接选择LInux-xbit即可，这个是可以搜索得到的，如果选择ubuntu16等搜不到。亲测直接搜索Linux 64-bit安装有效可用！）
将下载好的显卡驱动上传到服务器进行安装。

sudo ./NVIDIA-Linux-x86_64-430.34.run

采用该命令进行驱动程序的安装，安装完成后，采用nvidia-smi进行查看

CUDA安装

进入官网下载对应的CUDA版本，由于上面的操作已经得知了显卡驱动支持的CUDA版本和当前操作系统的版本号，因此可以很容易选择出合适的cuda版本
按照官网的操作下载cuda，并sudo sh cuda_*.run命令，从而进行安装。
安装过程中，第一步需要continue（显示管理器仍然开启，时候需要继续），第二步则是accept接受相应的条件，第三步则是去掉第一个安装驱动，即x去掉，下面的都不变

To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-10.1/bin

安装完成后，但是未配置环境变量，因此输入命令nvcc -V，提示没有找到对应的命令，需要进行环境变量的配置这时候cuda是安装好了，但是环境变量找不到cuda程序，自己手动修改环境变量文件，通过vim或者gedit修改，对应命令分别为vim ~/.bashrc和gedit ~/.bashrc，将下面的内容添加到文件最后，再通过source ~/.bashrc更新环境变量。

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

配置完成后，输入nvcc -V检查是否安装成功。
但是在之后运行develop的python环境时，遇到了问题

fatal error: cuda_runtime_api.h: No such file or directory

这其实是没有找到cuda地址（https://github.com/HawkAaron/warp-transducer/issues/15），因此可以通过 CUDA_HOME=/usr/local/cuda来进行声明

多版本的cuda管理，在/usr/local中存在cuda一个文件以及cuda-10.1等不同的版本cuda，而cuda是软连接到了安装的真正的cuda-10.0的地址，因此软连接的建立可以用于多个cuda版本的管理，只需要修改软连接就可以修改cuda的版本，而环境变量是指向的软连接，因此可以直接修改软连接即可。即删除旧的软连接再建立新的软连接方式来实现不同版本的cuda的切换。

sudo rm -rf cuda # 删除旧版本的软连接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda  # 建立新版本的软连接，前面的路径是需要的版本的cuda的安装路径。

CUDNN安装

一般来说，对于深度学习的环境配置，只需要通过conda命令安装pytorch，就会自动下载cudnn，因此暂时不需要安装CUDNN

「已注销」

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录