想用caffe训练的时候采用多个GPU,于是训练的时候使用了参数--gpu=0,1,2,3
但报错,报告显示must be specified for multi-GPU mode
于是查看了caffe的Makefile.config中的USE_NCCL,已经设成1了。但CMakeLists.txt中的USE_NCCL仍为OFF。
于是直接在CMakeLists.txt中设为ON。
进入build文件夹,cmake ..
发现显示的内容中nccl是disable,于是在安装nccl
安装步骤为
$ git clone https://github.com/NVIDIA/nccl.git
$ cd nccl
$ sudo make install -j8
好了之后再去build 文件夹make all -j8
之后训练就好了。
注意:
多GPU接口只支持C/C++,以及训练。