CUDA template kernel 与其他编译器合作编译

最新推荐文章于 2019-09-02 17:36:57 发布

VIP文章 aban-mtd

最新推荐文章于 2019-09-02 17:36:57 发布

阅读量1.2k

点赞数

分类专栏： CUDA 技巧 C/C++ 文章标签： cuda c语言编译器 kernel

本文链接：https://blog.csdn.net/bendanban/article/details/53575389

版权

在优化Kernel的时候，希望某些变量是常量，例如循环的次数相关的变量。如果次数限制是常量的话，编译器就可以将循环展开。展开的循环，会省掉一些判断，从而节省一些计算时间。

C++的模版中可以使用常量。但是我又不想所有的源代码都由nvcc来编译（其实C++的代码还是调用的host compiler），故此，我写这篇博客来提供一种方法。

实例中有三个文件：
main.cpp用host compiler来编译。
cuda_interfaces.cu 用nvcc来编译。

cuda_interfaces.h 是 cuda_interfaces.cu的接口头文件。

// main.cpp
#include <iostream>
#include "cuda_interfaces.h"
int main(int argc, char** argv){
    su::gpu_func<0>();
    su::gpu_func<1>();
    su

关注