使用百度云主机的GPU主机教程_第二部分

内容提要

第一部分:百度云主机GPU使用尝试

第二部分:下载机的软件安装(下载机,低配置的机器,用来下载东西)

第三部分:GPU机器的开通和查看

第四部分:GPU机器的软件安装

第五部分:GPU机器做实验

第一,二,三部分参考上一篇博文

 

第四部分:GPU机器的软件安装

参考老师第二课的cuda安装教程

参考博客:http://blog.csdn.net/u011331731/article/details/79332356

前提:

首先查看apt-get是否是国内:ok

(把阿里云的追加形式copy进去,update和upgroud 时遇到图形选择框,都选择了keep xxx的那一项(第一个是默认,第二个需要手工调整)))

修改pip的下载地址:ok

1、    添加驱动源

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

2、    安装Nvidia驱动

sudo apt-get install nvidia-367

sudo apt-get install mesa-common-dev

sudo apt-get install freeglut3-dev

执行上述3命令后应当验证是否安装ok

参考:http://blog.csdn.net/u010837794/article/details/63251725

执行完上述后,重启:

sudo reboot

必须要重启哦。重启后执行

nvidia-smi

如果出现了你的GPU列表,则说明驱动安装成功了

clip_image0163dd65c84-4c33-4dde-a89b-dff2da93a763

另外也可以通过:nvidia-settings查看自己机器上详细的GPU信息。这个会弹出图形界面的东西,不建议使用。

3,挂在数据盘到gpu机器,并将相关信息copy到gpu自带数据盘中

挂载已经数据的数据盘到gpu机器的目录下

执行:

mkdir /mntc

sudo mount /dev/vdc1 /mntc

之所以用/mntc而不是常用的/mnt是应为百度云床将GPU云主机时自动挂载了一个vdb的磁盘,200G的.这个磁盘占用了/mnt挂载点.(奇怪的是200G的磁盘在百度云的控制台中却没有显示出来)

执行:cp /mntc/download/* /mnt/

将数据盘中/download/数据都copy到Gpu自带的200G的磁盘中

4,安装cuda

sudo sh cuda_8.0.61_375.26_linux.run

注意1:

执行后会有一系列提示让你确认,非常非常非常非常关键的地方是是否安装361这个低版本的驱动:

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 361.62?

答案必须是n,否则之前安装的GTX1080驱动就白费了,而且问题多多。

参考:http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%BB%E6%9C%BA%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu-16-04-nvidia-gtx-1080-cuda-8

执行安装后显示

Driver:   Not Selected

Toolkit:  Installed in /usr/local/cuda-8.0

Samples:  Installed in /home/john, but missing recommended libraries

暂且认为正常。

6,更改配置文件

vim ~/.bashrc

添加

export PATH=/usr/local/cuda-8.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

补充说明:添加方式(先了解下vim的基本语法)

(vim ~/.bashrc

后依次执行如下按键

输入,shift+g,自动跳转到文件末尾

输入o,自动换行且转为输入模式

输入shift+insert,自动粘贴剪贴板内容

输入esc:退出编辑模式

输入:(注意这里的:是真的”冒号”,vim中表示命令模式,冒号后的wq!表示写入+强制退出(w表示保存,q表示退出,!叹号表示强制),简单来说就是先保存在退出)wq!:保存并且退出

)

再执行:

nvidia-smi看看是否正常。

在测试下刚才安装是否正常:

cd /usr/local/cuda/samples

cd 1_Utilities/deviceQuery

sudo make

执行正常后,在执行

./deviceQuery

应该会输出显卡信息,这里则说明cuda安装ok。

(若想进步一测试

cd ../../5_Simulations/nbody/

sudo make

./nbody -benchmark -numbodies=256000 -device=0

7,安装cudnn

tar -xzvf cudnn-8.0-linux-x64-v6.0.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d

sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

7,安装tensorflow-gpu

在安装tensorflow-gpu前需要留意

我们需要把python2的默认环境修改为python3的环境

需要参考文章:http://blog.csdn.net/u011331731/article/details/79185782

将numpy等都安装一遍后在安装tensorflow

按照文章中的安装后再安装tensorflow

pip install tensorflow-gpu==1.4(pip已经在~/.bashrc文件总alias为pip3了)

验证tensorflow的安装

clip_image018e4a38162-5e38-4682-89e0-85b25efed106

第五部分:GPU机器做实验

由于老师的tar包中以及有代码了,只需要解压后,按照实验步骤执行即可.

实验09,

clip_image02064f9a54f-0a97-4a67-8cdf-e09c50ed914f

实验10

clip_image0220803ac29-6bda-4477-9469-a4ee999a6d53

实验11

clip_image024de5c0821-5336-4d7a-82d1-9b5e9b757af2

实验12

clip_image0266c4d68e2-2c29-4415-82e8-5d721fdacc54

这个实验有报错,这里的报错应该就是第三次作业应该解决的问题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值