【2023·CANN训练营第一季】TIK C++调用核函数

TIKC++是一种基于C/C++的算子开发工具,它通过四层接口抽象和并行编程范式提高开发效率。核函数作为设备侧入口,允许用户自定义算子逻辑。调用核函数使用内建的<<...>>语法,指定执行配置如blockDim和stream。异步调用特性使得控制权在函数调用后立即返回主机侧,而aclrtSynchronizeStreamAPI用于同步等待所有任务完成。
摘要由CSDN通过智能技术生成

TIK C++ 是一种使用C/C++作为前端语言的算子开发工具,通过四层接口抽象、并行编程范式、孪生调试等技术,极大提高算子开发效率,助力Al开发者低成本完成算子开发和模型调优部署

核函数

核函数 (Kernel Function)TIK C++算子设备侧的入口。TIK C++允许用户使用核函数这种C/C++函数的语法扩展来管理设备仅的运行代码,用户在核函数中实现算子透辑的编写,例如自定义算子类及其成员函数以实现该算子的所有功能。核函数是主机侧和设备侧连接的桥梁

调用核函数

核函数的调用语句是C/C++函数调用语句的一种扩展

常见的C/C++函数调用方式是如下的形式:

function_name(argument list);

核函数使用内核调用符 <<<...>>> 这种语法形式,来规定核函数的执行配置:

kernel_name<<<blockDim, l2ctrl, stream>>>(argument list);
  • blockDim,规定了核函数将会在几个核上执行,每个执行该核函数的核会被分配一个逻辑ID,表现为内置变量*block_idx*,编号从0开始,可为不同的逻辑核定义不同的行为,可以在算子实现中使用
  • l2ctrl,保留参数,暂时设置为固定值*nullptr*
  • stream,类型为*aclrtStreamstream是一个任务队列,应用程序通过stream*来管理任务的并行
使用内核调用符 <<<…>>> 调用核函数:
HelloWorld<<<8, nullptr, stream>>>(fooDevice);

blockDim设置为8,表示在8个核上调用了HelloWorld核函数,每个核都会独立且并行地执行该核函数

Stream可以通过aclrtCreateStream来创建,它的作用是在当前进程或线程中显式创建一个aclrtStream

argument list设置为fooDevice这1个入参

核函数的调用是异步的,核函数的调用结束后,控制权立刻返回给主机侧

强制主机侧程序等待所有核函数执行完毕的API(阻塞应用程序运行,直到指定Stream中的所有任务都完成,同步接口)为*aclrtSynchronizeStream*

aclError aclrtSynchronizeStream(aclrtStream stream);
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值