深度环境配置ubuntu16.04 cuda8.0 cudnnv5.1

1 装系统,磁盘挂载:

查看当前磁盘信息
fdisk -l

分区,第一块盘是不需要挂载的,默认的名称都是sda
fdisk /dev/sdb
m:帮助
n:分区
p:对sdb进行分区,一般第二块盘我们可以作为数据盘,没必要进行分区,输入1或者不输入直接过,不输入默认是1,因为我没有对磁盘进行进一步细分,所以直接一路默认
w:写入分区

检查一下是否分区成功,然后对分区格式化
fdisk -l 查看每个分区的名称
mkfs.ext4 /dev/sdb1 格式化该分区,注意这边有个1,因为我只分了一个区,如果你分了多个分区,这边把sdb1改成2,3,4。。。以此类推,具体的名称可以用上面的fdisk -l

挂载
mount -t ext4 /dev/sda1 /mnt/sdc 后面的路径可以自己指定,随便挂载哪里都可以

添加uuid号
df -h 查看自己挂载的分区
注意:网上很多教程没用uuid,直接用的路径,理论上可行,但是因为我第一次在服务器上挂载失败了,用uuid成功了以后我就一直用的uuid号

ls -l /dev/disk/by-uuid/ 查看uuid号
vim /etc/fstab 自动挂载目录,添上之前所查看的uuid号,随手百度了个教程
uuid安装连接

2 深度环境配置

显卡驱动

可以直接在系统设置-软件和更新-添加附加驱动
或者输入指令

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-367

若电脑已经有了驱动,卸载即可
sudo apt-get remove –purge nvidia-*

注意:如果出现进不去图形界面,在国内的博客上几乎没有找到比较合适的解决方案,附上参考链接好了:
参考教程1
参考教程2

安装cuda8.0

卸载cuda8.0
针对自动安装的卸载
sudo apt remove nvidia-cuda-dev
sudo apt remove nvidia-cuda-toolkit
参考博客
针对.run文件的卸载
cd /usr/local/cuda-6.5/bin
sudo ./uninstall_cuda-6.5/pl
cd ..
sudo rm -rf cuda-6.5/

安装

sudo chmod +x cuda_8.0.44_linux.run
sudo sh cuda_8.0.44_linux.run (驱动选no)

环境变量的添加
用户环境

sudo vim ~/.bashrc
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

系统环境

sudo vim /etc/profile
export PATH=/usr/local/cuda/bin:$PATH

如果是.run文件安装则需要额外创建

sudo vim /etc/ld.so.conf.d/cuda.conf
/usr/local/cuda/lib64

使其生效
source /etc/profile
sudo ldconfig

如果这里报错,大多情况应该不会出现这个报错
/sbin/ldconfig.real: /usr/lib32/nvidia-375/libEGL.so.1 is not a symbolic link
解决方案

sudo mv /usr/lib/nvidia-375/libEGL.so.1 /usr/lib/nvidia-375/libEGL.so.1.org
sudo mv /usr/lib32/nvidia-375/libEGL.so.1 /usr/lib32/nvidia-375/libEGL.so.1.org
sudo ln -s /usr/lib/nvidia-375/libEGL.so.375.39 /usr/lib/nvidia-375/libEGL.so.1
sudo ln -s /usr/lib32/nvidia-375/libEGL.so.375.39 /usr/lib32/nvidia-375/libEGL.so.1

测试下是否安装成功了

nvcc -V
如果能检测出cuda,那么继续

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
sudo make all
sudo ./deviceQuery

如果显示PASS,则OK了,已经基本成功了

安装cudnn
这个就比较简单了
tar xzvf cudnn-8.0-linux-x64-v5.1.tgz
进入include打开终端
sudo cp cudnn.h /usr/local/cuda/include/
进入lib64打开终端
sudo cp lib* /usr/local/cuda/lib64

检查gcc版本,5.0以上支持会出现问题,一般有两种解决方案,使用gcc4.9或者取消cuda对gcc版本的支持。

这里选择第二种,先进入/usr/include/文件,找到host_config.h文件,进行修改。将判断gcc>5的三行代码给注释了。
这里写图片描述
然后将得到的cudnn文件操作一下,先进入/usr/local/cuda/lib64
sudo chmod +r libcudnn.so.5.1.5
sudo ln -sf libcudnn.so.5.1.5 libcudnn.so.5
sudo ln -sf libcudnn.so.5 libcudnn.so
sudo ldconfig

3 安装

安装conda:
cd ~/Downloads
chmod +x Miniconda3-latest-Linux-x86_64.sh
./ Miniconda3-latest-Linux-x86_64.sh

检查有没有安装成功:
conda -V

创建tensorflow环境,选Y安装必要的包:(这个是独立环境,可以和其他隔离,相当于VS的project)
conda create -n projectName python=3.5

帮我建立一个env, 叫ibugnet
conda create -n ibugnet python=3.5

打开环境:
source activate ibugnet

设置一下国内镜像
conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes
执行后,会生成~/.condarc

从开源软件menpo里安装一点landmark必要的库:
(ibugnet)$ conda install -c menpo menpo menpowidgets opencv

这里比较尴尬,我在服务器上成功了,却在我的台式机上失败了,显示menpo和python3.5冲突,后来我换了个安装指令解决了这个问题
conda install -c menpo menpoproject

检查一下安装的包
conda list

安装tensorflow
pip3 install –ignore-installed –upgrade tensorflow-0.11.0rc0-py3-none-any.whl

用mnist数据集测试一下tensorflow
python -m tensorflow.models.image.mnist.convolutional

最后关闭环境
source deactivate

  • -
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值