CUDA 多GPU调用实现

          当设备存在多块GPU时,为了高效利用GPU,我们常常需要使用多卡计算。本例中我们使用OpenMP来进行多线程调用多GPU运行,初学者无须详细了解OpenMP,只需知道一两句命令就行。

详细步骤如下:

1、建立一个普通CUDA项目:

2、在项目属性C/C++设置语言:支持openMP

3、在CUDA C/C++中设置预编译命令:-Xcompiler "/openmp"(这一行很重要)

4、设置CUDA C/C++ Host中运行库:为多线程库,如果工程为动态库,则设置为 “Multi-threaded DLL”,这个通常在调用CUDA动态库需要。

5、属性设置完以后,则接下来便使用OpenMP语句 【#pragma omp parallel for num_threads(N)  】进行多GPU调用。详细程序如下:


int subFunction()
{
    const int arraySize = 5;
    const int a[arraySize] = { 1, 2, 3, 4, 5 };
    const int b[arraySize] = { 10, 20, 30, 40, 50 };
    int c[arraySize] = { 0 };

	//查询GPU设备数量
	int deviceCount = 0;
	cudaGetDeviceCount(&deviceCount);
	if (deviceCount < 2) {
		printf("GPU device is less than Two.\n");
		return -1;
	}
	printf("Host CPUs:\t%d\n", omp_get_num_procs());

	//的使用OpenMP多线程调用多GPU进行计算
#pragma omp parallel for num_threads(deviceCount)
	for (int i = 0;i < deviceCount; i++) {
		printf("this is threads:%d Total threads is:%d\n", omp_get_thread_num(), omp_get_num_threads());
		//调用GPU内核程序
		addWithCuda(c, a, b, arraySize, 0);
	}
  
   
    return 0;
}

6、程序运行(由于本机只有一个GPU,多GPU卡具体测试结果就不奉上了)

 

自从毕业,好久没写博客了,,,,额,好像变懒了,,希望多更新吧,,,

 

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值