[Hasee-T97E]基于Ubuntu16.04的深度学习环境配置

安装ubuntu 16.04

  1. 使用ultraISO制作驱动盘, 打开.iso文件, 选择"启动"中的"写入硬盘映像", HDD+, 写入即可.
  2. 在boot界面上选择UEFI:+u盘符选择F4保存退出.
  3. 在"Install Ubuntu"选项上按e进入gurb编辑模式, 在quite splash后添加nomodeset nodmraid按F10保存进入安装界面. 相关解释
    1. 选择 English
    2. 选定 Install third-party software... continue
    3. 在 Installation type 中选择 something else 后 continue
    4. 大致按照 /boot--300m /--40000m /home--maximum swap--5000m 分配空间.所有type均选择logicalbegining of this space 最后要将boot loader引导至/boot所在盘符.留出10m左右的空闲空间.
    5. Where are you ? Shanghai continue
    6. keyboard English English(US)
    7. Who are you ? 设置名称 和 密码
    8. restart 拔出U盘
    9. 使用recovery mode 进入 ubuntu
    10. 在/etc/modprobe.d/blacklist.conf中添加 blacklist nouveau , 之后lspci | grep nouveausudo update-initramfs -u 再 reboot
    11. 可以直接进入ubuntu系统.

安装显卡驱动

  1. 使用recovery mode 进入, sudo gedit /etc/modprobe.d/blacklist.conf 添加 blacklist nouveau 使用 sudo update-initramfs -u 更新之后 reboot

  2. 先检验各种环境:

    1. 验证自己的电脑是否有一个可以支持CUDA的GPU:$ lspci | grep -i nvidia
    2. 验证自己的Linux版本是否支持 CUDA(Ubuntu 16.04没问题):$ uname -m && cat /etc/*release
    3. 验证系统是否安装了gcc:gcc --version若未安装请使用下列命令进行安装:sudo apt-get install build-essential
    4. 验证系统是否安装了kernel header和 package development
  • 查看正在运行的系统内核版本:

    1. 在终端中输入:$ uname –r

    2. 在终端中输入:$ sudo apt-get install linux-headers-$(uname -r)可以安装对应kernel版本的kernel header和package development 结果显示:......升级了 0 个软件包,新安装了 0 个软件包,要卸载 0 个软件包,有 4 个软件包未被升级。 表示系统里已经有了,不用重复安装。

  • 安装流程:

sudo apt-get --purge remove  nvidia-*

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

sudo apt install dkms build-essential linux-headers-generic

ubuntu-drivers devices # 查看可支持的驱动

sudo apt-get install nvidia-410

sudo apt-get install mesa-common-dev

sudo apt-get install freeglut3-dev 

sudo update-initramfs -u

sudo reboot

安装驱动后发生循环登录的状况时, 使用如下命令查看xsession-errors文档:
使用CTRL+ALT+F1 进入命令界面 并登录系统, 使用ls -a查看/home里是否有.xsession-errors文档

使用sudo vi .xsession-errors查看, 大部分问题出在如下报错:

openConnection: connect: No such file or directory
cannot connect to brltty at :0

该问题是安装驱动时同时安装OpenGL导致的, 使用:q退出.

删除已安装的驱动后, 需要使用安装包安装驱动.下载好驱动后, 进入非图形界面.

输入sudo /etc/init.d/lightdm stop

sudo /etc/init.d/lightdm status

cd到驱动文件夹后使用命令:

sudo chmod a+x NVIDIA-Linux-x86_64-375.20.run

sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files

安装,其中:

  • -no-x-check:安装驱动时关闭X服务

  • -no-nouveau-check:安装驱动时禁用nouveau

  • -no-opengl-files:只安装驱动文件,不安装OpenGL文件
    完成安装后,
    重启xserver?输入sudo /etc/init.d/lightdm restart

  • 06181444(已整合到代码区)

    • 报错, 报错内容说是在makefile时kernel发生错误, 推测原因是依赖项没有安装好, 首先使用sudo apt-get upgrade 升级一下
    • 下一步, 先sudo apt-get --purge remove nvidia-*再使用sudo apt update sudo apt install dkms build-essential linux-headers-generic安装一下依赖项, 最后再使用sudo apt-get install nvidia-396试一下

若以上各项验证检查均满足要求,便可进行下面的正式安装过程。如果没有满足要求的话,可以参考cuda的官方文档,里面有详细的针对每个问题的解决方案。

下载完后,用MD5检验,如果序号不和,得重新下载(由于当时没有保存,这里我采用了别人的截图,注意这里的cuda版本号,人家采用的cuda_8.0) 输入命令:$ md5sum cuda_9.0.176_linux.run

随后输入:

nvidia-smi

nvidia-setting

输出,则完成。

配置CUDA CUDNN

gcc降级

  • 如在运行cascade-rcnn的时候需要使用CUDA 8.0 && CUDNN 7.1, 但是Ubuntu 16.04自带的gcc版本为5.4, 与CUDA8.0支持的5.3不同.
    这里要注意的一点是ubuntu16.04的gcc版本是5.4,而cuda8.0在该系统中支持的gcc版本不超过5.3,所以第一步需要对GCC版本进行降级。
    以下操作方法源自 网址
  1. 下载gcc源码
wget ftp://mirrors.kernel.org/gnu/gcc/gcc-5.3.0/gcc-5.3.0.tar.gz

以上的下载链接,反正我用的是下载不下来,所以换成用以下的链接:

http://ftp.gnu.org/gnu/gcc/
  1. 解压
tar -zxvf gcc-5.3.0.tar.gz
  1. 下载编译所需依赖项:
cd gcc-5.3.0                    #进入解包后的gcc文件夹
./contrib/download_prerequisites#下载依赖项
cd ..                           #返回上层目录
  1. 建立编译输出目录:
mkdir gcc-build-5.3.0
  1. 进入输出目录,执行以下命令,并生成makefile文件:
cd gcc-build-5.3.0
../gcc-5.3.0/configure  --prefix=/usr/local/gcc-5.3.0 --enable-checking=release --enable-languages=c,c++ --disable-multilib
  • 注:/usr/local/gcc-5.3.0是自定的安装目录。将GCC安装在/usr/local/gcc-5.3.0目录下。为了以后的配置环境变量确立位置。
  1. 编译:
sudo make -j8

以上的编译过程大约40分钟左右。PS:最好不要在编译过程中再去做别的什么事,整个过程CPU都是满载的。

7.编译结束以后,我们就可以执行安装了:

sudo make install
  1. 环境设置(这里需要将gcc的头文件和库文件指向新的版本,否则电脑用的还是Ubuntu自带的gcc)

打开配置文件夹:

cd $HOME
ls -a
sudo gedit ~/.bashrc

向其中添加以下语句:

GCCHOME=/usr/local/gcc-5.3.0               #指定新安装gcc的搜索路径
PATH=$GCCHOME/bin:$PATH
LD_LIBRARY_PATH=$GCCHOME/lib
export GCCHOME PATH LLD_LIBRARY_PATH

重新引导,并查看gcc版本:

source $HOME/.bashrc
which gcc

会显示gcc新的路径为 /usr/local/gcc-5.3.0:

检查gcc和g++版本 :

gcc --version
g++ --version

gcc降级之后需要重新安装CUDA和CUDNN, 并且需要重新编译, 其中, 编辑时报错:

error while loading shared libraries libcudart.so.8.0: No such file or directory

解决办法按照libcudart.so.8.0介绍的方法一解决.`

安装 anaconda

官网下载后使用bash [安装包名称]即可.

安装 pytorch

conda install pytorch=0.4.0 cuda80 -c pytorch
conda install torchvision

安装pt1.1时, 需要安装cuda10.0, 可以使用nvidia-driver-410+cuda10.0+cudnn7.0的搭配完成.

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

deyiwang89

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值