oneAPI GPU 优化指南 - OpenMP 部署调优指南 - 术语

本章节翻译by chenchensmail@163.com  原文:Terminology (intel.com)

在本章中, OpenMP 和 SYCL 术语可以互换使用, 以描述部署并行循环的迭代分区。

如 “ SYCL 线程层次结构和映射” 一章所述, 部署到 GPU 上的并行循环(执行范围) 的迭代被划分为 work-group、sub-group 和 work-item。ND-range 表示总执行范围,它被划分为大小相等的 work-group。 一个工 work-group 是一个 1、2 或 3 维的 work-item 集合。 每个 work-group 可以划分为 sub-group。 sub-group 表示一小段连续的 work-item, 它们被一起作为 SIMD 向量处理。

下表显示了 SYCL 概念如何映射到 OpenMP 和 CUDA 概念。

SYCL

OpenMP

CUDA

Work-item

OpenMP thread or SIMD lane

CUDA thread

Work-group

Team

Thread block

Work-group size

Team size

Thread block size

Number of work-groups

Number of teams

Number of thread blocks

Sub-group

SIMD chunk (simdlen = 8, 16, 32)

Warp (size = 32)

Maximum number of work-items per work-group

Thread limit

Maximum number of of CUDA threads per thread block

上一章                                    主目录​​    上级目录                                                               下一章

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值