nvcc编译关闭警告linux,用clang++和nvcc编译cuda程序的一个例子

主函数在main.cpp中,用clang++编译[注:g++(gcc)不行,必须用clang++(clang)]

cuda函数放在KernelWrapper.cu中,用nvcc编译。另外main.cpp中需要包含头文件

KernelWrapper.h

#ifndef _KernelWrapper_h

#define _KernelWrapper_h

void RunTest();

#endif

KernelWrapper.cu

#include

#include "KernelWrapper.h"

__global__ void TestDevice(int *deviceArray)

{

int idx = blockIdx.x*blockDim.x + threadIdx.x;

deviceArray[idx] = deviceArray[idx]*deviceArray[idx];

}

void RunTest()

{

int* hostArray;

int* deviceArray;

const int arrayLength = 16;

const unsigned int memSize = sizeof(int) * arrayLength;

hostArray = (int*)malloc(memSize);

cudaMalloc((void**) &deviceArray, memSize);

printf("Init Data\n");

for(int i=0;i

{

hostArray[i] = i+1;

printf("%d\n", hostArray[i]);

}

cudaMemcpy(deviceArray, hostArray, memSize, cudaMemcpyHostToDevice);

TestDevice <<< 4, 4 >>> (deviceArray);

cudaMemcpy(hostArray, deviceArray, memSize, cudaMemcpyDeviceToHost);

printf("After Kernel Function\n");

for(int i=0;i

{

printf("%d\n", hostArray[i]);

}

cudaFree(deviceArray);

free(hostArray);

printf("done");

}

main.cp

#include "KernelWrapper.h"

int main( int argc, char** argv)

{

RunTest();

return 0;

}

Makefile

all: program

program: KernelWrapper.o main.o

clang++ -o program -L/usr/local/cuda/lib64 -lcuda -lcudart KernelWrapper.o main.o

KernelWrapper.o:KernelWrapper.cu

/usr/local/cuda/bin/nvcc -c KernelWrapper.cu

main.o: main.cpp

clang++ -c main.cpp

clean:

rm -f *.o program

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值