CUDA Pro Tip：Write Flexible Kernels with Grid-Stride Loops

最新推荐文章于 2022-05-29 13:51:16 发布

黑帽子和猫

最新推荐文章于 2022-05-29 13:51:16 发布

阅读量723

点赞数 1

分类专栏： CUDA

CUDA 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

见
CUDA Pro Tip：Write Flexible Kernels with Grid-Stride Loops
懒得翻译了，这篇文章讲使用Grid-Stride Loop
如下非Grid-Stride Loop

kernel()
{
    int i = blockIdx.x * blockDim.x + threadIdx.x;
    if (i<n)
        ....
}

Grid-Stride Loop

kernel()
{
    for (int i = blockIdx.x * blockDim.x + threadIdx.x; 
         i < n; 
         i += blockDim.x * gridDim.x) 
      {
          ...
      }
}

并表明这样做的三个有点
1. 可扩展和thread reuse
2. Debugging
3. Portability and readability

我认为吧主要就是前两个原因。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

黑帽子和猫

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
CUDA Pro Tip：Write Flexible Kernels with Grid-Stride Loops

见 CUDA Pro Tip：Write Flexible Kernels with Grid-Stride Loops
复制链接

扫一扫