OpenMP 中多 GPU、多stack和多 C-Slice 的显式扩展

测试

######################################################################

设备探索

*****************

在运行应用程序之前,建议运行 ``sycl-ls`` 命令来找出该平台上可用的设备,特别是当运行是为了性能测量时。 这可确保运行不会采用后备路径。

OpenMP 中多 GPU、多stack和多 C-Slice 的显式扩展

上下文

**********

OpenMP 上下文是隐式的。 runtime创建并管理上下文,但添加了一个用于查询 OpenMP 上下文的 Intel 扩展( ``omp_target_get_context()`` )以支持 ``interop`` 。

USM(Unified Shared Memory)

*******************************

添加了三个新的 OpenMP API 作为 USM 内存分配的Intel扩展。 还添加了对 USM 的 ``omp_target_alloc`` API 支持。 请参阅 :ref:`openmp_usm_allocation-chinese` 部分了解详细信息。

与子子设备关联的上下文

***************************************

创建其中包含单个子子设备的上下文,并将队列附加到该子子设备(compute slice)。 在该方案中,执行/可见性仅限于子子设备,并期望在compute slice(C-slice)级别提供细粒度的划分和控制。 看一个代码示例:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值