【总结】服务器上配置:Ubuntu14.04+cuda7.5+caffe+远程链接

【涉及到的内容】:

  1. Ubuntu1404的安装
  2. 安装cuda7.5.run
  3. 编译caffe的C++, python, Matlab接口
  4. 配置远程登陆(SSH,VNC)
  5. 配置py-faster-rcnn
  6. FTP配置

【1. Ubuntu14.04的安装】

安装系统没有什么难的,此外,现在基于linux做深度学习开发的主流系统版本就是1404,问题少,好配置。这些有点足够了,那么我要说的是安装完系统以后可能会出现的问题。比如: sudo apt-get update  之后会出现Hash mismatch 等这样的错误。

问题原因:出现这样的错误是网络问题造成的,如果忽略不好,后面安装一些东西会报各种各样的问题。

解决办法:我是用手机4G开的热点,然后服务器插上无线网卡,用手机流量update的(一把心酸泪啊!!),知道update成功,一般也就30M左右的流量。

【2. 安装cuda-7.5】

安装cuda-7.5 常用的方式有两种:一种是用包管理器deb安装,另一种是用run文件安装。

1)我之前一直用deb方式安装,优点是操作简单而且问题少,安装方式如下:

$ sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb

$ sudo apt-get update

$ sudo apt-get install cuda       #如果update 成功 则 这步就一定会成功。
在安装完成后记得重启电脑,驱动才能有效。

$ sudo reboot
然后编译cuda自带的Samples,运行deviceQuery 的demo就可以看到结果。


2)如果重启之后你进不去系统了,也就是卡在登陆密码的界面,一输入密码之后黑屏一下,然后又退回到登陆界面。这种问题叫login loop

问题原因:显卡驱动安装失败。

解决办法:网上有很多,但是都没有解决,最后我选择重装系统,用run文件安装cuda。

(注:用run文件安装真的很麻烦,但是最后work了,这就是管用的)

  • 以终端的方式登陆系统(ctrl+Alt+F2)
  • 查看nouveau的驱动,如果有任何打印的信息就说明他还工作着
$ lsmod | grep nouveau
  • 将nouveau加入黑名单,失能它
$ vi  /etc/modprobe.d/blacklist-nouveau.conf 
 
##############---blacklist-nouveau.conf file---------
blacklist nouveau 
options nouveau modeset=0
###########----blacklist-nouveau.conf file Done---------
  • 重新生成kernel
$ sudo update-initramfs -u
  • 重启服务器,然后再查看一遍nouveau的驱动是否还在,如果什么都没有打印就说明禁止成功了。
  • 禁止nouveau成功以后再次以终端的方式登陆系统
  • 禁止X-window服务
$ sudo service lightdm stop
  • 安装cuda-7.5_XXX.run 文件
$ sudo ./{file_location}/cuda-7.5_XXX.run
安装的时候会先让你看一遍协议,你看空格快速看就ok,然后是一些选项,除了openGL那个是NO以外,其他的都是默认或者接受。
安装后的提示应该是:
==========
= Summary =
==========

Driver: Installed
Toolkit: Installed in /usr/local/cuda-7.5
Sample: Installed in /home/XX ,but missing recommend libraries

这样就算安装完成了。
  • 打开X-Windows服务
$ sudo service lightdm start
  • 重启电脑
$ sudo reboot

至此,安装cuda完成,再次登陆系统,编译NVIDIA-Samples 就ok了!

---[Uninstall CUDA]

To uninstall the CUDA Toolkit:
     
$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl

To uninstall the CUDA Driver :
$ sudo /usr/bin/nvidia-uninstall



【3. caffe的配置】

没有什么难的,网上一堆,有时间再自己写。。。

【4.远程登陆】

1.SSH 参考百度经验配置,相当简单

配置ssh

2.VNC

需要安装vnc4server

# sudo apt-get install vnc4server

安装vnc使用gnome桌面,因为它的配置简单,和ubuntu自带的unity桌面也很像

# sudo apt-get install gnome-panel gnome-settings-daemon 

# sudo apt-get install metacity nautilus gnome-terminal

然后启动vncserver

# vncserver   :1

然后会在~目录下出现.vnc的文件夹修改   ~/.vnc/xstartup 文件,如下:


关闭vncserver以后重新启动

# vncserver  -kill  :1
# vncserver   :1

到此,服务器端配置结束。

【5. py-faster-rcnn的配置】

遇到的问题: 安装scipy失败

问题的原因: 因为scipy需要gfortran编译, 因为新系统里面没有,所以会报错。

解决方法: 1)先  sudo apt-get install gfortran

2)再 pip install scipy


遇到的问题: Check failed: error == cudaSuccess (8 vs. 0) invalid device function

问题的原因: 显卡的计算能力和默认的不匹配

解决方法: http://blog.csdn.net/u013078356/article/details/51009470


【6. FTP配置】

按照网上的教程配置好FTP以后,在通过ftp向服务器上传文件的时候遇到如下问题:

ftp> put lenet_solver.prototxt /home/yue/uftp
200 PORT command successful. Consider using PASV.
553 Could not create file.

解决办法:

$ sudo mkdir /var/ftp/write
$sudo chmod -R 777 /var/ftp/write

$sudo gedit /etc/vsftpd.conf     ##然后修改vsftp的配置文件/etc/vsftpd.conf文件
在最后添加上
local_root=/var/ftp

$sudo service vsftpd restart   ##保存,然后杀死vsftpd进程,然后重启vsftpd服务器程序。

附FTP的一些基本操作:

>>> ftp XXX.XXX.XXX.XXX
用户名:。。
密码:。。

>> lcd   路径    #移动到本地目录

>> cd   路径     #移动服务器到路径

>>put  file   路径  # 将本地文件 上传到服务器

>>get                  #从服务器上下载文件到本地。





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值