CUDA Nvcc 编译流程

最新推荐文章于 2024-08-25 12:44:21 发布

cs199503

最新推荐文章于 2024-08-25 12:44:21 发布

阅读量211

点赞数

文章标签： python

注：以下档案为转载：

如果你想了解Nvcc到底搞了什么鬼，究竟compute_xy sm_xy区别在哪里，ptx,cudabin

又是怎么嵌套到exe里面最终被驱动执行的，这一节正是你想要的知识。他将讲解每一个编

译的具体步骤，而且不光是知识，读者可以自己动手操作来体验这一个过程。他的用处不仅

在能够对CUDA的编译以及工作机制有更深的认识，而且可以进行高级debug，比如可以自

己手动进行ptx->cudabin的步骤等等。

参考：nvcc2.1.pdf 由于水平有限，错误部分欢迎大家留言指出

作者：insky(wenyao2009(at)gmail.com)

主页：www.gamecoding.cn

1. 一个编译例子

随意找一个包含kernel以及kernel调用的.cu文件，如x.cu。进入命令行:敲打nvcc–cuda

x.cu –keep 将得到如下结果，-cuda是将.cu编译成.cu.cpp，-keep保留中间结果。（如果提示

找不到nvcc请在path中添加%cuda_bin_path%）

打开.cu 文件所在目录（此处是ptx）,你会惊讶的发现多出了一大堆文件，是的，很烦，

不过很快你将会喜欢上他们，因为他们把nvcc 的工作流程完美的记录下来了。好吧，那我

们开始吧。

2. Virtual architecture vs GPUfeature

首先定位到文件x.cu, x.ptx, x.sm_10.cubin这三个文件上来，他们按照下图流程依次生

成，x.cubin,x.ptx最终会被嵌套到x.cu.cpp 中。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/22785983/viewspace-619550/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/22785983/viewspace-619550/

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。