在Atlas上做推理(5)-推理

最新推荐文章于 2023-11-17 09:32:13 发布

lenlrx李睿昕

最新推荐文章于 2023-11-17 09:32:13 发布

阅读量504

点赞数

分类专栏：在Atlas上做推理文章标签：深度学习人工智能

原文链接：https://zhuanlan.zhihu.com/p/383373155

版权

5 篇文章 0 订阅

订阅专栏

经过了这么多这么多铺垫，终于可以进入正题了！

目前在ACL中我们一般使用aclmdlExecuteAsync[1]接口调用NPU做推理，下面是调用的流程[2]:

简单来说生成离线模型就是把现在AI框架的prototxt/pb/onnx等模型文件编译成NPU能运行的om文件，详细介绍请参考文档[4]。我也提供了一个简单的yolov3模型转换的例子:

生成离线模型需要使用atc工具，atc工具需要一台PC安装CANN的开发环境，配置开发环境比较复杂，我写了一份Dockerfile，有需要的人可以使用这个脚本直接构建镜像，节省时间。

AIPP是一个对模型输入做预处理的模块，比如NPU的输入是视频解码的YUV420SP格式的图片，然而神经网络模型需要的RGB格式的输入，这个时候就需要使用AIPP完成这个YUV->RGB格式的转换。AIPP文档

关注