CUDA的编译

最新推荐文章于 2024-01-20 20:52:22 发布

cs870101

最新推荐文章于 2024-01-20 20:52:22 发布

阅读量3.6k

点赞数

分类专栏： CUDA 文章标签： cuda 编译器工具 c api 工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cs870101/article/details/4047289

版权

CUDA 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

CUDA的编译器为nvcc,nvcc将各种编译工具集成起来，这些编译工具实现了编译的不同阶段。nvcc的基本工作流是将device代码从host代码中分离出来，然后将其编译成二进制或者cubin工程。在执行过程中，将忽略host代码，而将device代码加载并通过CUDA的设备API来执行。

CUDA源代码在编译器前端是基于c++语法的。host代码中能够全部支持C++，但是在device中只能支持c++中的C部分。在kernel中不允许有C++的类、继承以及在基本块中定义变量等语法。C++中的void类型指针不能在没有类型转化的前提下赋值给一个非void的指针。

nvcc的更多介绍请见：http://download.csdn.net/source/1173428

__noinline__

__device__函数在默认情况下是内联的，通过__noinline__限定符能够提示编译器不要将指定的函数内联。编译器不支持指针参数和大量参数的函数使用__noinline__

#pragma unroll

编译器默认情况下将循环展开小的次数，#pragma unroll 能够指定循环以多少次展开（程序员必须保证按这个展开是正确的），例如

#pragma unroll 5

for()

pragma unroll 后必须紧接着处理的循环。

#pragmatic unroll 1 禁止编译器将循环展开。

如果没指定次数，对于常数次的循环，循环将完全展开，对于不确定次数的循环，循环将不会被展开。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CUDA的编译

CUDA的编译器为nvcc,nvcc将各种编译工具集成起来，这些编译工具实现了编译的不同阶段。nvcc的基本工作流是将device代码从host代码中分离出来，然后将其编译成二进制或者cubin工程。在执行过程中，将忽略host代码，而将device代码加载并通过CUDA的设备API来执行。CUDA源代码在编译器前端是基于c++语法的。host代码中能够全部支持C++，但是在device中只能
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。