Ascend C算子开发能力中级认证考试心得分享
- 连接开发板
连接电源,网线,IP地址统一设置为192.168.137.100,初始密码Mind@123,cmd下可用
ssh root@192.168.137.100 - 下载考题代码,主要补充op_host、op_kernel端代码文件,代码参考如下:
sinh_custom.cpp:


op_host端


-
代码补齐后,在SinhCustom算子工程目录中构建

构建成功后,将其安装到环境中: cd build_out ./custom_opp_ubuntu_aarch64.run进入AclNNInvocation目录测试:
bash run.sh出现You have passed the precision即成功,提交AclNNInvocation与SinhCustom文件夹zip包即可
最后给一些参考的知识点笔记:
整个算子计算过程阶段分析:CopyIn,Compute,CopyOut
CopyIn:搬入x到Local内存
Compute:使用Local内存进行计算
CopyOut:搬运Local计算结果到z使用__global__函数类型限定符来标识它是一个核函数,可以被<<<…>>>调用;使用__aicore__函数类型限定符来标识该核函数在设备端AI Core上执行。
compute函数一些调用:
Exp(xLocal, xLocal, TILE_LENGTH);:对从输入队列取出的本地张量 xLocal 进行指数运算(Exponential)。这用于计算 e^x,其中 x 是 xLocal 中的元素。TILE_LENGTH 是可能是一个常量,表示操作的长度。
Reciprocal(zLocal, xLocal, TILE_LENGTH);:计算 1/xLocal 的倒数,并将结果存储在 zLocal 中。
Muls(zLocal, zLocal, scalar, TILE_LENGTH);:将 zLocal 中的每个元素乘以标量 scalar,并将结果存储回 zLocal。
133

被折叠的 条评论
为什么被折叠?



