注:以下档案为转载:
如果你想了解Nvcc到底搞了什么鬼,究竟compute_xy sm_xy区别在哪里,ptx,cudabin
又是怎么嵌套到exe里面最终被驱动执行的,这一节正是你想要的知识。他将讲解每一个编
译的具体步骤,而且不光是知识,读者可以自己动手操作来体验这一个过程。他的用处不仅
在能够对CUDA的编译以及工作机制有更深的认识,而且可以进行高级debug,比如可以自
己手动进行ptx->cudabin的步骤等等。
参考:nvcc2.1.pdf 由于水平有限,错误部分欢迎大家留言指出
作者:insky(wenyao2009(at)gmail.com)
主页:www.gamecoding.cn
1. 一个编译例子
随意找一个包含kernel以及kernel调用的.cu文件,如x.cu。进入命令行:敲打nvcc–cuda
x.cu –keep 将得到如下结果,-cuda是将.cu编译成.cu.cpp,-keep保留中间结果。(如果提示 找不到nvcc请在path中添加%cuda_bin_path%)
打开.cu 文件所在目录(此处是ptx),你会惊讶的发现多出了一大堆文件,是的,很烦,
不过很快你将会喜欢上他们,因为他们把nvcc 的工作流程完美的记录下来了。好吧,那我
们开始吧。
2. Virtual architecture vs GPUfeature
首先定位到文件x.cu, x.ptx, x.sm_10.cubin这三个文件上来,他们按照下图流程依次生 成,x.cubin,x.ptx最终会被嵌套到x.cu.cpp 中。 |
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22785983/viewspace-619550/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/22785983/viewspace-619550/