背景是:想使用多GPU训练模型
报这样的错,首先检查darknet下的Makefile是否修改正确----》三处位置
报错时的Makefile文件:
【第一处】---->多个博客是这样写的
GPU=1
CUDNN=1
OPENCV=1
OPENMP=0
DEBUG=0
【第二处】---->cuda-11.1是我自己的cuda版本,需修改成自己的安装版本
NVCC=/usr/local/cuda-11.1/bin/nvcc
【第三处】---->cuda-11.1是我自己的cuda版本,需修改成自己的安装版本
ifeq ($(GPU), 1)
COMMON+= -DGPU -I/usr/local/cuda-11.1/include/
CFLAGS+= -DGPU
LDFLAGS+= -L/usr/local/cuda-11.1/lib64 -lcuda -lcudart -lcublas -lcurand
endif
实际按照上面三处修改,会报[obj/convolutional_layer.o] Error 1 或者[obj/convolutional_kernels.o] Error 1错误
修改方法
第二处和第三处不变,修改第一处,如下
GPU=1
CUDNN=0
OPENCV=1
OPENMP=0
DEBUG=0
再make就可以通过了,并且测试可以用多GPU训练