cuda
翼1729
这个作者很懒,什么都没留下…
展开
-
cuda学习笔记(二)add_tree
详细源码见本人github点这里比较经典的树状加法示意图具体的计算流程如下图所示:继续进一步的kernel函数解析为:其中引入两个变量offset与mask原创 2019-10-23 11:23:10 · 439 阅读 · 0 评论 -
cuda学习笔记(一)
一、基础的API先是线程id的索引:tid= (blockIdx.ygridDim.x+blockIdx.x) blockDim.xblockDim.y+threadIdx.yblockDim.x+threadIdx.x;Kernel函数1、参数Dg用于定义整个grid的维度和尺寸,即一个grid有多少个block, 为dim3类型Dim3 。Dg(Dg.x, Dg.y, 1)表示g...原创 2019-10-23 10:53:41 · 264 阅读 · 0 评论