在C文件中调用CUDA(编译中命令的正确顺序,避免踩坑)

在C文件中调用CUDA

最近在写一些CUDA的kernel,想要给C项目中的一些逻辑加入并行结构进行加速,但是尽量维持嵌入的形势,也就是最终还是进行.c文件的执行,也就需要在.cu中写kernel和执行function,之后再在.c文件中调用。
但是看了几个blogs在编译的时候都会出现问题,花了我一些时间来解决,现在记录下来避免以后走弯路。

先上代码和编译指令
main.c

#include <stdio.h>

extern int func(void);

void main() {
   
    printf("Running Demo \n");
    func();
}

kernel.c

#include <stdio.h>

__global__ void vector_add(int *a, int *b, int *c)
{
   
    /* insert code to calculate the index properly using blockIdx.x, blockDim.x, threadIdx.x */
	int index = blockIdx.x * blockDim.x + threadIdx.x;
	c[index] = a[index] + b[index];
}

/* experiment with N */
/* how large can it be? */
#define N (2048*2048)
#define THREADS_PER_BLOCK 512

extern "C" int func()
{
   
    int *a, *b, *c;
	int *d_a, *d_b, *d_c
  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值