Caffe使用多GPU——Ubuntu16.04+CUDA9+CUDNN6配置NCCL

1. 下载nccl

$ git clone https://github.com/NVIDIA/nccl.git

2. build

$ cd nccl

$ make -j src.build

注意:如果你的CUDA不是安装在常规的路径/usr/local/cuda,需要指定CUDA的路径

make -j src.build应改为:

$ make -j src.build CUDA_HOME=/usr/local/cuda-9.0 (此为小编cuda路径)

$ make -j src.build NVCC_GENCODE="-gencode=arch=compute_70,code=sm_70" (可选)

3. Install

安装在debian和Ubuntu上:

$ # Install tools to create debian packages

$ sudo apt install build-essential devscripts debhelper

$ # Build NCCL deb package

$ make pkg.debian.build

$ ls build/pkg/deb/

4. 测试是否安装成功

$ git clone https://github.com/NVIDIA/nccl-tests.git

$ cd nccl-tests

$ make

$ ./build/all_reduce_perf -b 8 -e 256M -f 2 -g <ngpus>

<ngpus>为你的gpu个数,不报错则安装成功。

5. 错误记录

报错:找不到-lnccl的错误

/usr/bin/ld: cannot find -lnccl

collect2: error: ld returned 1 exit status

解决办法:

$ sudo gedit /etc/ld.so.config

在末尾加入 INCLUDE /home/cv503/nccl/build/include

$ sudo ldconfig

然后再:

$ sudo gedit ~/.bashrc

加入nccl的头文件和库

export LD_LIBRART_PATH=/home/cv503/nccl/build/lib:$LD_LIBRART_PATH

LD_LIBRART_PATH测试的时候还是报错的的话直接改为LIBRART_PATH

export LIBRART_PATH=/home/cv503/nccl/build/lib:$LIBRART_PATH

6. 配置caffe的多GPU

由于之前编译的无多GPU,首先在Caffe的根目录下:

$ make clean

  1. 修改makefile文件
  2. 修改makefile.config文件加入以下语句:

USE_NCCL := 1
INCLUDE_DIRS += /home/cv503/nccl/build/include
LIBRARY_DIRS += /home/cv503/nccl/build/lib

    3. 最重要的步骤——修改caffe根目录下的cmake下的Moduels下的FindNCCL.cmake文件

在相应位置加入红色语句:

set(NCCL_INC_PATHS

    /usr/include

/usr/local/include

/home/cv503/nccl/build/include

    $ENV{NCCL_DIR}/include

)

set(NCCL_LIB_PATHS

    /lib

    /lib64

    /usr/lib

    /usr/lib64

    /usr/local/lib

/usr/local/lib64

/home/cv503/nccl/build/lib

    $ENV{NCCL_DIR}/lib

    )

 4. 修改Cmakelists.txt文件

caffe_option(USE_NCCL "Build Caffe with NCCL library support" OFF)

OFF改为ON

5. rebuild CAFFE

在CAFFE的根目录下

$ mkdir build

$ cd build

$ sudo cmake .. -DCUDA_NVCC_FLAGS=”-D_FORCE_INLINES”  -DUSE_CUDNN=ON -DUSE_NCCL=ON

没有报错则进行下一个命令:

$ sudo make -j4

将python写入环境变量

$ gedit ~/.bashrc

export PYTHON_PATH=

$ python

$ import caffe

不报错就成功.

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Ubuntu 16.04中安装Docker并使用GPU时出现问题,首先需要确保你的系统配置符合Docker和Caffe GPU的要求。以下是一些可能的解决方案: 1. 确保你的系统支持NVIDIA GPU:首先,检查你的计算机上是否安装了NVIDIA显卡驱动程序。可以使用以下命令检查驱动程序是否已成功安装并正在运行: ``` nvidia-smi ``` 如果该命令能够成功启动,并显示NVIDIA显卡的信息,则说明驱动程序已成功安装。 2. 安装NVIDIA Docker:Docker在GPU支持方面需要使用NVIDIA Docker插件。你可以按照NVIDIA Docker官方文档中的步骤安装,包括添加apt存储库、安装软件包和配置插件等。 3. 配置NVIDIA运行时:在使用Docker时,使用NVIDIA运行时可以确保Docker能够正确地使用GPU。你可以通过编辑`/etc/docker/daemon.json`文件来配置NVIDIA运行时,确保该文件中包含以下内容: ``` { "runtimes": { "nvidia": { "path": "nvidia-container-runtime", "runtimeArgs": [] } }, "default-runtime": "nvidia" } ``` 保存并退出该文件,然后重新启动Docker服务: ``` sudo systemctl restart docker ``` 4. 运行Docker容器使用GPU:在运行Caffe容器时,确保你在`docker run`命令中使用了`--runtime=nvidia`选项,以确保容器能够使用GPU。例如: ``` docker run --runtime=nvidia caffe-gpu-image ``` 这将使用NVIDIA运行时在容器中启动Caffe,并允许它使用GPU加速。 通过执行以上步骤,你应该能够在Ubuntu 16.04上安装Docker并成功使用GPU运行Caffe。如果问题仍然存在,请检查是否遵循了正确的安装步骤,并查看系统日志以获取更多信息。如果问题仍然无法解决,你可以搜索相关的错误信息或向社区等其他资源寻求帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值