CUDA template kernel 与其他编译器合作编译

最新推荐文章于 2022-10-18 21:12:36 发布

aban-mtd

最新推荐文章于 2022-10-18 21:12:36 发布

阅读量1.3k

点赞数

分类专栏： CUDA 技巧 C/C++ 文章标签： cuda c语言编译器 kernel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bendanban/article/details/53575389

版权

本文探讨了在CUDA编程中如何利用C++模板和常量优化Kernel，通过在.cu文件中声明常量函数，使得编译器能够展开循环以提高计算效率。示例代码展示了如何组织源文件，确保模板的正确编译和使用。

摘要由CSDN通过智能技术生成

简介

在优化Kernel的时候，希望某些变量是常量，例如循环的次数相关的变量。如果次数限制是常量的话，编译器就可以将循环展开。展开的循环，会省掉一些判断，从而节省一些计算时间。

C++的模版中可以使用常量。但是我又不想所有的源代码都由nvcc来编译（其实C++的代码还是调用的host compiler），故此，我写这篇博客来提供一种方法。

代码实例

实例中有三个文件：
main.cpp用host compiler来编译。
cuda_interfaces.cu 用nvcc来编译。

cuda_interfaces.h 是 cuda_interfaces.cu的接口头文件。

// main.cpp
#include <iostream>
#include "cuda_interfaces.h"
int main(int argc, char** argv){
    su::gpu_func<0>();
    su::gpu_func<1>();
    su

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

aban-mtd

CSDN认证博客专家 CSDN认证企业博客

码龄15年

278: 原创

2万+: 周排名

117万+: 总排名

225万+: 访问

: 等级

1万+: 积分

966: 粉丝

674: 获赞

484: 评论

1056: 收藏

私信

关注

热门文章

分类专栏

最新评论

科研技能养成
evering98: 有一个图论的问题，如果有兴趣，可联系微信evering7，与我探讨交流，如何？非常感谢！
计算机为什么要用补码？
做而论道_CS: 另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾吗！进位，是小学二年级的知识点吧？　舍弃进位，很难理解吗？　老外竟然能弄出那么大一堆概念！　老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，直接就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。在大学里面，一天一天的，兜着圈子讲小学的知识。而且，居然还成为了考研的内容！真是毁人不倦坑人不浅哪！这些老师，捡个鞋拔子就当成玉如意了。天天蒙骗学生，自己赚取名声和丰厚的讲课费。顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！小结一下：所谓的 “补码”，也是数，并非是：　符号位原码取反加一、正数三码相同！所谓的 “补码”，它都是正数。　只不过，加上这些正数，能够产生进位。　舍弃进位之后，这些正数，就能当成负数使用了。 “补码” 的关键，在于【舍弃进位】。　所谓的 “机器数真值符号位原码反码” 等等，　　都没有任何用处。　　　我们也不必再纠结这些垃圾！上过小学的人，人人都能理解【舍弃进位】。　老外，当然就不同了。　　他们还需要进化。－－－－－－－－－－－－－－－－注意：学习高级语言（如 C 语言）的人，　往往就忘记了 “什么是进位”。　因为，在高级语言中，根本就没有进位的概念。高级语言，是针对那些，没有文化的人，而开发的。　正常人学习高级语言后，学来学去的，就变的愚昧了。
计算机为什么要用补码？
做而论道_CS: 在两位十进制运算时，舍弃进位，就是：减去一百。那么，加 99、再减 100，当然就是 “－1” 了！计算机使用二进制数。二进制数，也是数，并不是什么码，八位二进制数是：0000 0000 ~ 1111 1111。也就是十进制数：0 ~ 255。八位二进制的进位，是：2^8 = 256。那么：加 255 (1111 1111)，再减 256，就是－1 ！同理：＋254 (1111 1110)，就是－2。　　　＋253 (1111 1101)，就是－3。　　　。。。　。。。　　＋128 (1000 0000)，就是－128。以上这些正数，就是计算机专家 “发明” 的补码！你如果上过中学，你一定能推出关系式：　负数的补码＝ 256 ＋负数。一般化：　负数的补码＝ 2^n ＋负数。　n，是补码的位数。例：求－31 的补码是什么？解：256－31 = 225 = 1110 0001 (二进制)。这不就求出来了吗？哪里还用什么 “原码取反加一”！－－－－－－－－－－－－－－－－－求正数的补码，公式也是雷同的：　正数的补码 = 256 + 该正数。要知道，加上 256，就是出现一个进位。　进位必须舍弃，所以，256 就不用加了。于是，公式可以简化为：　正数的补码 = 该正数。在此处，这就证明了：　零和正数的补码，就该数字本身。举例，就不用了吧。计算机专家也是说：　正数的补码，就是该正数。但是，他们并没有给出证明。为什么不加以证明呢？因为这些专家：　弄不懂什么是进位，　更不懂什么是舍弃进位！
计算机为什么要用补码？
做而论道_CS: 你看十进制吧，两位数：0 ~ 99。可以有：27 + 99 = (一百) 26 另外有：27 － 1 = 26 如果你忽略进位，仍旧保持两位数，　这两种算法，功能就是相同的。即，舍弃了进位：　正数，就能当负数使用。　加法，就能实现减法运算。在计算机中舍弃进位，会怎样？　可以省掉减法器，从而简化硬件。　只用一个加法器，即可横行天下！所谓的 “补码”，并不是什么什么码。别看它是二进制，二进制数，也是正常的数字。所谓的 “补码”，根源在于【舍弃进位】！并不是因为什么：机器数真值符号位取反加一！
计算机为什么要用补码？
做而论道_CS: 为什么要使用补码？－－－－－－－－－－－－－实际上，计算机，根本就【不使用补码】！计算机使用的是二进制数。作为数字来说，二进制数，也是数。并不是什么：原码反码补码。计算机专家告诉你说：使用补码。这是在蒙你唬你骗你！实际上，他们是偷偷的【舍弃了进位】。实际上，他们使用的，还是正常的数字！

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。