CUDA并行编程学习心得2

(正在学习CUDA中, 写一些自己学习中的心得,如有错误,欢迎指正~)

P

     在一个__global__函数调用__device__函数的程序中, 编译时出现错误,如下:

      C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V110\BuildCustomizations\CUDA 8.0.targets(687,9): error MSB3721: 命令“"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin\nvcc.exe" -gencode=arch=compute_20,code=\"sm_20,compute_20\" --use-local-env --cl-version 2012 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin\x86_amd64"  -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include"     --keep-dir x64\Release -maxrregcount=0  --machine 64 --compile -cudart static     -DWIN32 -DWIN64 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W3 /nologo /O2  /Zi  /MD " -o x64\Release\kernel.cu.obj "...\kernel.cu"”已退出,返回代码为 2。

T

    新建一个CUDA项目,使用系统默认的例程,在__global__函数中调用__device__函数,编译通过,结果正确。

       故排除显卡版本过低的因素(因为本机显卡为GT630,计算能力2.1,所以日常怀疑显卡有问题)。尝试了好多种解决方法后, 终于找到了解决问题的方法:在__global__函数中调用这个__device__函数之前,再次声明这个__device__函数!

       问题解决了,可以疑惑并没有消失。为什么其他程序可以直接调用而编译通过呢?

----------------------------------------------------------------------------------------------------------------

因为自己粗心外面的声明少了两个变量!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值