这个是CUDA里面最基本最重要的问题了,一定要非常清楚:
函数定义的时候不需要加上这个符号,只有在调用函数的时候才需要——它被用于指定函数在GPU中具体怎样去执行(分多少block,block是多少维度;每个block分多少thread,维度,几行几列多少深度等等;需要多少shared memory):
函数名<<<第一个参数,第二个参数,第三个参数>>>(...);
第一个参数:grid里有多少个块,是怎样组织的(维度,几行几列多深)
第二个参数:每个block里有多少个thread,是怎样组织的(维度,几行几列多深)
第三个参数:shared memory大小,可以省略。
参见“深入浅出”P10,和"指南"的P5,以及本人的系列文章: