深度环境配置ubuntu16.04 cuda8.0 cudnnv5.1

最新推荐文章于 2019-03-02 21:36:57 发布

minione_2016

最新推荐文章于 2019-03-02 21:36:57 发布

阅读量1.2k

点赞数 1

分类专栏： ubuntu 文章标签： ubuntu cuda 服务器硬盘磁盘

本文链接：https://blog.csdn.net/minione_2016/article/details/53192716

版权

ubuntu 专栏收录该内容

23 篇文章 1 订阅

订阅专栏

1 装系统，磁盘挂载：

查看当前磁盘信息
fdisk -l

分区,第一块盘是不需要挂载的，默认的名称都是sda
fdisk /dev/sdb
m:帮助
n:分区
p:对sdb进行分区，一般第二块盘我们可以作为数据盘，没必要进行分区，输入1或者不输入直接过，不输入默认是1，因为我没有对磁盘进行进一步细分，所以直接一路默认
w:写入分区

检查一下是否分区成功，然后对分区格式化
fdisk -l 查看每个分区的名称
mkfs.ext4 /dev/sdb1 格式化该分区，注意这边有个1，因为我只分了一个区，如果你分了多个分区，这边把sdb1改成2，3，4。。。以此类推，具体的名称可以用上面的fdisk -l

挂载
mount -t ext4 /dev/sda1 /mnt/sdc 后面的路径可以自己指定，随便挂载哪里都可以

添加uuid号
df -h 查看自己挂载的分区
注意：网上很多教程没用uuid，直接用的路径，理论上可行，但是因为我第一次在服务器上挂载失败了，用uuid成功了以后我就一直用的uuid号

ls -l /dev/disk/by-uuid/ 查看uuid号
vim /etc/fstab 自动挂载目录，添上之前所查看的uuid号，随手百度了个教程
uuid安装连接

2 深度环境配置

显卡驱动

可以直接在系统设置-软件和更新-添加附加驱动
或者输入指令

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-367

若电脑已经有了驱动，卸载即可
sudo apt-get remove –purge nvidia-*

注意：如果出现进不去图形界面，在国内的博客上几乎没有找到比较合适的解决方案，附上参考链接好了：
参考教程1
参考教程2

安装cuda8.0

卸载cuda8.0
针对自动安装的卸载
sudo apt remove nvidia-cuda-dev
sudo apt remove nvidia-cuda-toolkit
参考博客
针对.run文件的卸载
cd /usr/local/cuda-6.5/bin
sudo ./uninstall_cuda-6.5/pl
cd ..
sudo rm -rf cuda-6.5/

安装

sudo chmod +x cuda_8.0.44_linux.run
sudo sh cuda_8.0.44_linux.run (驱动选no)

环境变量的添加
用户环境

sudo vim ~/.bashrc
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

系统环境

sudo vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH

如果是.run文件安装则需要额外创建

sudo vim /etc/ld.so.conf.d/cuda.conf
/usr/local/cuda/lib64

使其生效
source /etc/profile
sudo ldconfig

如果这里报错，大多情况应该不会出现这个报错
/sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 is not a symbolic link
解决方案

sudo mv /usr/lib/nvidia-375/libEGL.so.1 /usr/lib/nvidia-375/libEGL.so.1.org
sudo mv /usr/lib32/nvidia-375/libEGL.so.1 /usr/lib32/nvidia-375/libEGL.so.1.org
sudo ln -s /usr/lib/nvidia-375/libEGL.so.375.39 /usr/lib/nvidia-375/libEGL.so.1
sudo ln -s /usr/lib32/nvidia-375/libEGL.so.375.39 /usr/lib32/nvidia-375/libEGL.so.1

测试下是否安装成功了

nvcc -V
如果能检测出cuda,那么继续

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
sudo make all
sudo ./deviceQuery

如果显示PASS，则OK了，已经基本成功了

安装cudnn
这个就比较简单了
tar xzvf cudnn-8.0-linux-x64-v5.1.tgz
进入include打开终端
sudo cp cudnn.h /usr/local/cuda/include/
进入lib64打开终端
sudo cp lib* /usr/local/cuda/lib64

检查gcc版本，5.0以上支持会出现问题，一般有两种解决方案，使用gcc4.9或者取消cuda对gcc版本的支持。

这里选择第二种，先进入/usr/include/文件，找到host_config.h文件，进行修改。将判断gcc>5的三行代码给注释了。
这里写图片描述
然后将得到的cudnn文件操作一下，先进入/usr/local/cuda/lib64
sudo chmod +r libcudnn.so.5.1.5
sudo ln -sf libcudnn.so.5.1.5 libcudnn.so.5
sudo ln -sf libcudnn.so.5 libcudnn.so
sudo ldconfig

3 安装

安装conda：
cd ~/Downloads
chmod +x Miniconda3-latest-Linux-x86_64.sh
./ Miniconda3-latest-Linux-x86_64.sh

检查有没有安装成功：
conda -V

创建tensorflow环境，选Y安装必要的包：（这个是独立环境，可以和其他隔离，相当于VS的project）
conda create -n projectName python=3.5

帮我建立一个env, 叫ibugnet
conda create -n ibugnet python=3.5

打开环境：
source activate ibugnet

设置一下国内镜像
conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes
执行后，会生成~/.condarc

从开源软件menpo里安装一点landmark必要的库：
(ibugnet)$ conda install -c menpo menpo menpowidgets opencv

这里比较尴尬，我在服务器上成功了，却在我的台式机上失败了，显示menpo和python3.5冲突，后来我换了个安装指令解决了这个问题
conda install -c menpo menpoproject

检查一下安装的包
conda list

安装tensorflow
pip3 install –ignore-installed –upgrade tensorflow-0.11.0rc0-py3-none-any.whl

用mnist数据集测试一下tensorflow
python -m tensorflow.models.image.mnist.convolutional

最后关闭环境
source deactivate