集群服务器环境下安装Caffe深度学习库(GPU)

本文介绍了如何在使用Grid Engine和SLURM的集群服务器环境下安装Caffe深度学习库,强调了无根权限安装以及依赖库管理的重要性。通过模块管理加载CUDA、BLAS、Boost、OpenCV等必要库,并提供了一个脚本来简化环境设置。最后,详细说明了Caffe的Makefile.config配置,包括启用cuDNN加速的步骤。
摘要由CSDN通过智能技术生成

关于配置Berkeley Caffe深度学习库的帖子网上已经有很多了, 不过大多数都是基于本地机进行配置.

我个人的一部分研究涉及到用深度学习对数字病理学图片进行分类(基于像素),因为图像量很大所以需要用到集群计算并利用GPU加速.个人觉得自己在算法和理论上并不算深入,在具体应用上大概有一年左右经历.

集群环境下配置和本地机配置过程最大区别在于大多数情况下我们没有根权限, 因此需要把Caffe和依赖库安装在用户目录下.

我在两个不同的集群环境中进行过Caffe的配置和运行, 资源管理软件分别是Grid Engine(CWRU)和SLURM(Buffalo), 二者在对于运行Caffe上大同小异,在具体环境和资源申请时候会有略微不同.

CWRU和Buffalo的集群服务器都支持模块管理,因此方便动态按需求加载和卸载资源. Caffe对于依赖库的版本要求比较苛刻,因此使用模块管理可以更好的控制依赖库版本和对应的环境变量.

首先,我们需要查一下Caffe依赖的库,具体可以从官网查到,大致概括一下:

1.CUDA肯定是必须的, 如果用GPU.推荐7.0版本,6.5也行,5.5以下不确定是否会出问题

2.BLAS(线性代数和矢量操作库), 可以是ATLAS,MKS,OpenBLAS中的任意一个

3.Boost,大于1.55版本

4.OpenCVS,大于2.4版本(3.0可以)

5.protobuf, glog, gflags 等等

6.hdf5, leveldb, snappy, lmdb

7.如果需要python和matlab接口,需要分别编译其各自接口:

   1)Python Caffe, python 2.7 或者 python 3.3+, numpy版本大于1.7, 含有boost的boost.python

   2)Matlab, MATLAB还有mex编译器

8.cuDNN (如果GPU支持cuDNN并且想启用cuDNN加速)


现在,我们先检测一下集群服务器上有哪些库已经安装我们只需要加载即可,使用命令,module avial


可以发现其实很多库已经存在,只需加载即可. 为了运行Caffe时方便,我的做法是写一个脚本,把所有要加载的库都写在里面,用Caffe之前运行一下即可. 具体做法是, 我在这个路径下简历一个文件~/.usr/local/share/modulefiles/caffe_dependencies

  1. module load cmake
  2. module load hdf/5-1.8.11
  3. module load cuda/6.5
  4. module load intel-mpi/4.1.3
  5. module load vtk/6.0.0
  6. module load python/anaconda
  7. module load opencv/2.4.10
  8. module load boost/1.57.0
  9. module load mkl/11.2
  10. module load google-api/11.06.2014
到这里,我们把能通过加载解决的依赖库解决了,剩下就是得我们自己安装在用户目录下. 我自己喜欢安装在~/.usr/local目录下,因此
cd ~/.usr/local
然后就是git一下列源码
  1. git clone https://github.com/google/leveldb.git
  2. git clone https://github.com/schuhschuh/gflags.git
  3. git clone https://github.com/google/protobuf.git
  4. git clone https://github.com/google/glog.git
  5. git clone https://gitorious.org/mdb/mdb.git
  6. git clone https://github.com/google/snappy.git
  7. </
  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值