华为 AscendCL库笔记

闲客blog

于 2024-03-27 11:55:08 发布

阅读量1k

点赞数 12

文章标签：笔记 java 服务器

本文链接：https://blog.csdn.net/weixin_44812601/article/details/137072275

版权

1. AscendCL主要接口调用流程

调用 aclInit 接口，开始对AscendCL进行初始化操作。

需要注意的是，一个进程内只能调用一次 aclInit 接口。

在对运行管理资源进行申请时，需要按以下顺序依次申请：Device->Context->Stream。

在这里插入图片描述

在这里插入图片描述

数据预处理主要使用两大工具AIPP(AI Preprocessing)和DVPP(Digital Vision Preprocessing)。

DVPP中主要提供了5个功能模块，包括视频编码模块(VENC)、视频解码模块(VDEC)、JPEG图片解码(JPEGE)、JPEG图片解码(JPEGD)、视觉预处理模块(VPC)

相比于模型加载，单算子的加载与执行不同之处在于模型文件的加载、算子输入数据的传输和单算子的执行

单算子模型加载
- 调用 aclopSetModelDir ，设置加载模型文件的目录，目录下存放单算子模型文件（*.om文件）
- 调用 aclopLoad，从内存中加载单算子模型数据，由用户管理内存。单算子模型数是指“单算子编译成的*.om文件后，再将om文件读取到内存中”的数据
将算子输入数据从 Host 复制到 Device
- 调用 aclrtMemcpy 实现同步内存复制
- 调用 aclrtMemcpyAsync 实现异步内存复制
单算子的执行
- 自行构造算子描述信息（输入输出Tensor描述、算子属性等）、申请存放算子输入输出数据的内存、调用 aclopExecute 接口加载并执行算子
- 自行构造算子描述信息（输入输出Tensor描述、算子属性等）、申请存放算子输入输出数据的内存、调用aclopCreateHandle接口创建一个Handle、再调用aclopExecWithHandle接口加载并执行算子。