cuda核函数再调用核函数，多层并行

最新推荐文章于 2024-04-25 13:23:46 发布

lingerlanlan

最新推荐文章于 2024-04-25 13:23:46 发布

阅读量6.9k

点赞数

分类专栏： cuda(GPU programming) 文章标签：核函数 cuda 多层并行

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lingerlanlan/article/details/26258117

版权

cuda(GPU programming) 专栏收录该内容

20 篇文章 1 订阅

订阅专栏

#include <stdio.h>



__global__ void childKernel(int i)
{
	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	printf("parent:%d,child:%d\n",i,tid);
	for(int j=i;j<i+10;j++)
	{
		printf(",%d",j);
	}
	printf("\n");
}

__global__ void kernel()
{

	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	childKernel<<<1,2>>>(tid);
}

int main()
{

	kernel<<<1,1>>>();
	cudaDeviceSynchronize();

return 0;
}

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lingerlanlan CSDN认证博客专家 CSDN认证企业博客

码龄14年

163: 原创

4万+: 周排名

78万+: 总排名

95万+: 访问

: 等级

1万+: 积分

805: 粉丝

256: 获赞

359: 评论

314: 收藏

私信

关注

热门文章

分类专栏

最新评论

gpu数组赋值各种方法性能测试
沉迷学习的拿铁: 2是什么意思？
python多线程读取同一个文件
m0_55812171: 有10来个文件每个文件有40万行左右并且都要单独写入msyql,多进程好办，但是多线程就有点困难了。大佬能把每个文件从读取到写入的事件缩短到70秒吗
Java实现简单版SVM
小凹兔: 1、ctrl+C 2、ctrl_V 3、点击运行即可
Java实现简单版SVM
xgjdl1314: 麻烦问一下这个我该怎么执行使用呀，新手菜鸟有点白痴。。。。
发现用new和malloc分配的内存，元素都为0,太神奇了（求助各位网友！！）
聆听--风雨: malloc 和不带括号的new，申请出来的空间并不总是0。文章中的例子总是为0有两种可能：1、编译器优化自动初始化为0了，2、分配的内存区域之前从来未被修改过。另外，new int[10]()这种方式是会初始化为0的，带上括号就会调用对象的默认构造函数，对int而言就是初始化为0.

大家在看

R语言绘制线性回归图 214

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。