Ubuntu18.04下深度学习环境搭建及问题解决(双系统+2080Ti显卡)

本文使用的是SSD+机械安装双系统,先安装Win10,然后是Ubuntu18.04,显卡是Nvidia 2080TI

1. Win10,Ubuntu18.04双系统安装

见我另一篇博客

2.安装显卡驱动

如果只想在Windows下玩深度环境的可以看我另外一篇博客

  • 删除系统自带的不适配的NVIDIA驱动

sudo apt-get purge nvidia-*

  • 安装完毕后,通过命令行方式禁用自带的驱动:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

添加以下内容:

blacklist nouveau

再更新一下

sudo update-initramfs -u

修改后需要重启系统。确认下Nouveau是已经被你干掉,使用命令: lsmod | grep nouveau

如果没有结果,说明已经禁掉。

  • 安装官网NVIDIA 2080TI驱动(有问题)

网上很多帖子说用官网驱动,我在官网上下载得到的最新驱动就是NVIDIA-Linux-x86_64-410.78.run,运行安装过程中提示编译该驱动的版本比系统自带GCC的版本低,可能会出现兼容性问题,忽略该提示继续安装后,重启后出现问题3。

  • 使用Ubuntu第三方仓库中的驱动

网上很多说用Ubuntu第三方仓库中的NVIDIA驱动比较老旧,但可能近期已经更新,版本比官网还高。

这里采用自动安装:

添加PPA仓库:sudo add-apt-repository ppa:graphics-drivers/ppa

更新:sudo apt-get update

输入命令:ubuntu-drivers devices

显示出支持的显卡驱动有:

== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==

modalias : pci:v000010DEd00001180sv00001458sd0000353Cbc03sc00i00

vendor : NVIDIA Corporation

driver : nvidia-driver-418 -third-party-free

driver : nvidia-driver-410 -third-party-free

driver : nvidia-driver-430 -third-party-free recommended

driver : nvidia-driver-415 -third-party-free

driver : xserver-xorg-video-nouveau - distro free builtin

可以看到PPA仓库中已经有最新的2080TI驱动:sudo ubuntu-drivers autoinstall 即可reboot

安装完reboot发现卡在紫色界面,没有任何显示,CTRL+ALT+F2进入命令行模式,使用nvidia-smi命令可以正常显示N卡信息,说明驱动安装正常,问题出在显示上。

3.安装完毕后的问题解决
  • /dev/sda6:clean / files, ***/***blocks

安装完毕后是默认使用Ubuntu的启动菜单,可以选择进入Win10还是Ubuntu。选择进入Ubuntu后屏幕上方出现/dev/sda6:clean / files, ***/***blocks,一直卡在这里没有用。网上查找了很长时间,主要解决方法有两种:

1.CTRL+ALT+Fn进入命令行,输入fsck /dev/sda6,对我无效。

2.Ubuntu自带显卡驱动与NVIDIA显卡不兼容,CTRL+ALT+Fn进入命令行,输入sudo apt-get purge nvidia*删除所有NVIDIA相关显卡,对我无效。

最终折腾了半天找到第三种奏效的方法:

sudo apt install lightdm

然后重启

  • /dev/sda6:Super Blocklast Mount time is in the future

/dev/sda6是我的/分区,出现这个提示,在启动时候进入Ubuntu高级选项,选择recover模式->root,然后fsck /dev/sdb6

4. 安装Cuda

nvidia官网下载cuda DEB格式,后输入命令安装即可,我这里先下载最新的CUDA10.1,官网有安装说明:


sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.168-418.67_1.0-1_amd64.deb

sudo apt-key add /var/cuda-repo-10-1-local-10.1.168-418.67/7fa2af80.pub

sudo apt-get update

sudo apt-get install cuda

安装完后重启一下

nvcc -V 看到CUDA信息说明正常。

PS:如果安装的是性能低一些的,支持的是CUDA9.0的显卡,可能还设计GCC、G++的降级等,见我另一篇博客,这里不提。

5.安装cudnn

官网下载,选择第三个cuDNN Library for Linux,选择和CUDA10.1适配的cudnn,我下载的是cudnn-10.1-linux-x64-v7.6.2.24.tgz。

解压缩后cd到cuDNN目录,执行以下操作:


sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

接下来编辑path环境变量文档:sudo gedit ~/.bashrc

将cuda的环境变量加到打开的文件最后:


export LD_LIBRARY_PATH=”$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64”

export CUDA_HOME=/usr/local/cuda

export PATH="$CUDA_HOME/bin:$PATH"

souce以下使环境配置生效:source ~/.bashrc

6.安装Anaconda
  • 官网太慢从清华源下载,我下载的是最新的Anaconda3-5.3.1-Linux-x86_64.sh,Python是3.7的,可以通过建立虚环境来设置Python版本,所以没关系。

安装:bash Anaconda3-5.3.1-Linux-x86_64.sh

然后看清楚提示,该yes的要yes,其中要加入环境变量,同时安装到最后会帮你安装VSCode,我比较喜欢这个IDE,不太喜欢重量级的Pycharm,所以也YES安装。

  • 改为国内源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --set show_channel_urls yes

添加pytorch源,不然安装贼慢

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

  • 创建虚环境

这个Anaconda默认Python是3.7的,可能与很多包还不太兼容,所以建立虚环境。

conda create -n deeplearning python=3.6

创建的是Python3.6.8的环境

  • 安装深度学习环境

source activate deeplearning

conda install tensorflow-gpu

conda install pytorch torchvision

source deactivate deeplearning

可以看到安装的是tensorflow-gpu-1.14.0和pytorch-1.1.0

  • 让Jupyter-notebook能支持新创建的虚环境

source activate deeplearning

conda install nb_conda

source deactivate deeplearningcon

source activate base

conda install nb_conda

source deactivate base

这样进入jupyter notebook尽可以创建新建的deeplearning虚环境下的notebook

  • 修改jupyter notebook默认的工作路径

在终端输入:jupyter-notebook --generate-config

用gedit打开上述命令输出的路径文件,在其中搜索c.NotebookApp.notebook_dir =,原本前面有#表示注释,删除#后将需要变更的路加入即可

VScode虚环境支持
  • 菜单中文显示

F1后输入language display,现在install other language,安装中文,重启vscode

  • 常用插件的安装

个人觉得vscode比较强大的就是插件库,加上一些插件后如虎添翼,这里推荐几个插件:

(1)Python:这个是vscode提供的python 官方插件,提供了python代码的调试,自动补全,代码格式化等功能

(2)vscode-icons:这个也是vscode官方提供的插件,作用是给vscode编辑的文件增加图标。这里再推荐一个相同功能的插件vscode-icons-mac,文件图标变成Mac风格,相当美观。

(3)Path Intellisense:这个插件的作用是当代码中读入文件名或者文件路径时,提供文件名或者文件路径的自动补全

(4)topper:这个插件的作用是在.pyw文件的开头添加一些说明header

(5)Bracket Pair Colorizer:这个插件的作用是给代码中的括号增加颜色,同一对括号是相同的颜色,尤其是在括号中还包着括号的时候,看起来更加的清晰。

(6)Code Spell Checker:代码拼写检查器

(7)guides:显示代码对齐辅助线

(8)Rainbow Brackets:圆括号,方括号和大括号提供彩虹色。

(9)Indent-Rainbow:用四种不同颜色交替着色文本前面的缩进

(10)filesize:在状态栏中显示当前文件大小,点击后还可以看到详细创建、修改时间

(11)Atuo Rename Tag:修改 html 标签,自动帮你完成头部和尾部闭合标签的同步修改

(12)beautify:格式化代码工具

  • 虚环境的支持

没有网上说得那么负责,需要改变配置文件之类,直接F1快捷键输入python:select interpreter就可以看到虚环境,选择即可应用到当前项目。

  • 测试

在vsode中写个代码测试一下是否成功:

import tensorflow as tf
import torch
with tf.device('/cpu:0'):
a = tf.constant([1.0,2.0,3.0],shape=[3],name='a')
b = tf.constant([1.0,2.0,3.0],shape=[3],name='b')
with tf.device('/gpu:1'):
c = a+b
#注意:allow_soft_placement=True表明:计算设备可自行选择,如果没有这个参数,会报错。
#因为不是所有的操作都可以被放在GPU上,如果强行将无法放在GPU上的操作指定到GPU上,将会报错。
sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True,log_device_placement=True))
#sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
sess.run(tf.global_variables_initializer())
print(sess.run(c))
print(torch.cuda.is_available())

不得不说,深度学习环境在Linux下还是要容易得多,Windows下安装和使用中会出一些莫名其妙的问题,在Ubuntu下很简单。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Ubuntu 18.04深度学习环境搭建需要以下步骤: 1. 安装CUDA和cuDNN:CUDA是NVIDIA提供的用于GPU加速的并行计算平台,cuDNN是NVIDIA提供的用于深度学习的GPU加速库。可以从NVIDIA官网下载对应版本CUDA和cuDNN,并按照官方文档进行安装。 2. 安装Anaconda:Anaconda是一个Python发行版,包含了许多常用的科学计算库和工具。可以从Anaconda官网下载对应版本安装包,并按照官方文档进行安装。 3. 创建虚拟环境:可以使用conda命令创建一个新的虚拟环境,例如: ``` conda create --name env_name python=3.6 ``` 这将创建一个名为env_name的虚拟环境,并安装Python 3.6。 4. 安装深度学习框架:可以使用conda命令安装常用的深度学习框架,例如TensorFlow、PyTorch、Keras等,例如: ``` conda install tensorflow-gpu ``` 这将安装TensorFlow GPU版本。 5. 安装其他依赖库:根据需要安装其他依赖库,例如numpy、scipy、matplotlib等。 完成以上步骤后,就可以在虚拟环境中进行深度学习开发了。 ### 回答2: Ubuntu 18.04是一种非常优秀的开源操作系统,尤其适用于深度学习环境搭建。在本文中,我们将为大家详细介绍在Ubuntu 18.04上如何搭建深度学习环境。 首先,我们需要安装Ubuntu 18.04操作系统。我们建议下载官方镜像进行安装安装完毕后,我们需要安装CUDA(NVIDIA计算统一设备架构)和cuDNN(NVIDIA深度神经网络)。以下是安装步骤: 1. 安装Cuda Toolkit 我们可以通过官网直接下载tar文件进行安装: $ wget https://developer.download.nvidia.com/compute/cuda/10.0/secure/Prod/local_installers/cuda_10.0.130_410.48_linux.run $ sudo sh cuda_10.0.130_410.48_linux.run 在安装过程中会有多项选择,我们建议选择默认选项并自定义CUDA安装位置。 安装完成后,我们需要将CUDA添加到环境变量中。打开终端,运行以下命令: $ sudo gedit ~/.bashrc 在打开的文件的末尾添加以下代码: export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH 保存文件,然后运行以下命令以使配置生效: $ source ~/.bashrc 2. 安装cuDNN cuDNN是用于加速深度学习的库,我们可以在NVIDIA的官网上下载。请注意,您需要注册才能下载库。 下载后将压缩包解压缩,并将文件复制到CUDA安装目录中: $ tar -xzvf cudnn-10.0-linux-x64-v7.4.2.24.tgz $ cd cuda $ sudo cp include/cudnn.h /usr/local/cuda/include $ sudo cp lib64/libcudnn* /usr/local/cuda/lib64 $ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* 3. 安装Anaconda Anaconda是一个强大的Python包管理器,可以轻松管理Python和相关库的版本。我们可以通过官方网站下载并安装Anaconda。 安装完成后,打开终端,输入以下命令以检查是否安装成功: $ conda list 如果显示了安装包列表,则说明安装成功。 4. 创建虚拟环境 为了避免不同的Python库版本之间的冲突,我们建议使用虚拟环境进行开发。使用以下命令创建一个名为env的虚拟环境: $ conda create -n env python=3.7 此命令将创建一个名为env的虚拟环境,并将Python版本设置为3.7。 5. 安装所需的Python库 安装深度学习需要的Python库非常重要,以下是必要库的清单: $ conda install -n env numpy matplotlib pandas jupyter scikit-learn tensorflow-gpu keras 请注意,虽然我们使用了tensorflow-gpu库,但这意味着你需要一张NVIDIA GPU显卡并正确设置CUDA和cuDNN。 如果您的电脑没有NVIDIA GPU显卡,则不需要安装tensorflow-gpu库。 6. 使用Jupyter Jupyter是一个非常好的交互式开发环境,我们建议在虚拟环境中安装jupyter。输入以下命令: $ conda install -n env jupyter 然后输入以下命令启动jupyter: $ jupyter notebook 最后,您将能够成功地在Ubuntu 18.04上搭建深度学习环境并开始进行深度学习开发。 ### 回答3: 深度学习是当今热门的领域之一,如果要在Ubuntu 18.04上搭建深度学习环境,需要以下几个步骤: 1. 安装 NVIDIA 显卡驱动 要在Ubuntu上使用深度学习,必须安装视频和GPU驱动程序。相比于CPU,在GPU上训练深度学习模型要快很多,因此推荐使用Nvidia GPU。 首先你需要下载并安装NVIDIA的驱动程序,可以使用下面的命令查看可用的版本: ``` ubuntu-drivers devices ``` 选择最新版本的驱动程序(如果你的GPU是较旧的版本,可以考虑选择旧版本的驱动程序)并安装: ``` sudo apt install nvidia-driver-<version> ``` 2. 安装CUDA和cuDNN CUDA和cuDNN是与NVIDIA GPU兼容的深度学习框架。CUDA为GPU提供并行计算解决方案,cuDNN用于优化深度学习模型的性能。 可以使用以下命令安装CUDA: ``` sudo apt install nvidia-cuda-toolkit ``` 对于cuDNN,需要先从Nvidia开发者网站下载相对应的cuDNN版本,解压并将文件复制到/usr/local/cuda/路径下: ``` sudo cp <path_to_downloaded_file>/libcudnn* /usr/local/cuda/include/ sudo cp <path_to_downloaded_file>/libcudnn* /usr/local/cuda/lib64/ ``` 3. 配置Anaconda Anaconda是一个包含许多用于深度学习的科学计算库的平台,因此我们需要安装Anaconda。 首先从Anaconda官网下载适用于Ubuntu的Anaconda安装包,然后运行以下命令来安装: ``` bash Anaconda<version>-Linux-x86_64.sh ``` 4. 创建虚拟环境 为了保持深度学习环境的干净和整洁,我们将在Anaconda上创建虚拟环境并在其中安装所有必要的包。 使用以下命令创建具有Python3的新虚拟环境: ``` conda create --name <env_name> python=3.6 ``` 处于安全起见,我们建议使用Python3.6来进行深度学习。 使用以下命令激活虚拟环境: ``` conda activate <env_name> ``` 5. 安装深度学习框架 在虚拟环境中使用以下命令安装需要的深度学习框架,如Tensorflow、Keras、PyTorch 等等: ``` conda install tensorflow keras pytorch torchvision -c pytorch ``` 最后,您已成功地在Ubuntu 18.04上搭建了深度学习环境。现在您可以使用Python和相应的深度学习框架,从而开始探索深度学习的奇妙世界。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值