OpenCL异构扩展

OpenCL异构扩展并非标准部分,而是通过扩展提供额外功能。扩展通常分为Khronos批准的cl_khr系列,无需一致性测试的cl_ext系列,以及厂商特定扩展。例如,cl_khr_fp64扩展启用双精度支持,cl_ext_device_fission用于设备拆分,GPU printf扩展助力内核调试。OpenCL扩展增强了GPU功能,包括新数据类型和跨设备缓冲处理。
摘要由CSDN通过智能技术生成

OpenCL异构扩展并不是OpenCL标准的一部分,它是指device支持某种特性,且在默认状态下,所有的扩展都是禁止的。但是OpenCL通过扩展,厂商可以给device增加一些新的功能,且不用考虑兼容性的问题。

就目前市场行情来看,各个厂商在OpenCL的实现中或多或少的使用了自己的扩展,体现了特殊性。

一般来说扩展的类型分为三种情况,如下所示:

1、以cl_khr作为扩展名属于Khronos OpenCL工作组批准的扩展,需要经过一致性测试。比如:#pragma OPENCL EXTENSION命令控制OpenCL编译器在语言扩展方面的行为。该命令的定义如下,其中extension_name是扩展的名字。

#pragma OPENCL EXTENSIONextension_name: behavior  

#pragma OPENCL EXTENSION all :behavior  

behavior: enable or disable 

extension_name的格式为cl_khr_<name>,同时有一个形如cl_<vendor_name>_<name>的名字作为供应商扩展。扩展必须得到OpenCL工作组的允许。标志all表示编译器支持的所有扩展。

enable使extension_name所代表的扩展有效。如果不支持extension_name或者使用all,则报告一个错误。

disable扩展extension_name排除在语言定义外。如果使用all,编译器把代码作为无扩展的核心版本处理,如果不支持extension_name,就会产生警告提示信息。

#pragma OPENCL EXTENSION cl_khr_fp64 : enable  

double x = 2.0; 

指令#pragma OPENCL EXTENSION是设置每个语言扩展行为的、简单的、低级的机制。它没有定义那些组合是合适的,这些是在其他地方定义的。需要注意的是,此类命令的顺序会影响结果,后出现的命令会覆盖前面的命令。

2、以cl_ext为扩展名的外部扩展。这种扩展是由2个或2个以上的厂商发起,并不需要进行一致性测试。比如cl_ext_device_fission扩展,通过该扩展把一个设备分成多个子设备,每一个设备都有自己的队列,主要是多核cpu以及Cell Broadband Engine使用,该扩展由AMD,Apple,Intel以及IBM四家联合提出。

对于每个子设备,都有自己的queue,把不同任务发送到两个子设备中,这里需要注意的是,把设备拆分为子设备,首先要了解该设备的架构,然后根据任务及device架构进行拆分。

3、厂商自己的扩展,比如GPU printf扩展,主要用来debug kernel代码。

enum cudaLimit { 

 cudaLimitStackSize  = 0x00,  // GPU thread stack size

 cudaLimitPrintfFifoSize = 0x01,  // GPU printf FIFOsize 

 cudaLimitMallocHeapSize = 0x02  // GPU malloc heapsize 

}; 

 

OpenCL扩展了GPU用于图形生成之外的能力,支持新数据类型,比如三维矢量和新增图像格式,支持处理多Host指令以及跨设备Buffer处理,如想对OpenCL有更深入的了解,还需自己动手实践。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值