OpenVINO工具套件高级课程第四课：如何进行AI推理的性能对比?

同学来啦

已于 2022-04-07 17:01:12 修改

阅读量1.3k

点赞数 1

分类专栏：工具套件文章标签： openvino

于 2022-03-20 22:24:13 首次发布

本文链接：https://blog.csdn.net/zhouqiping/article/details/123621518

版权

工具套件专栏收录该内容

12 篇文章 1 订阅

订阅专栏

本文详细探讨了影响神经网络推理性能的关键因素，包括神经网络参数的选择、设备数据格式和内存管理，以及执行参数如同步/异步、张量尺寸、推理请求和视频流设置。通过实例对比，提供了如何通过调整这些参数提升推理效率的实用建议。

摘要由CSDN通过智能技术生成

💂 个人主页: 同学来啦
🤟 版权: 本文由【同学来啦】原创、在CSDN首发、需要转载请联系博主
💬 如果文章对你有帮助，欢迎关注、点赞、收藏和订阅专栏哦

一、示例分析

在这里插入图片描述
两个流水线比较：
①流水线-1：延迟更短，响应时间短；
②流水线-2：吞吐量更大

二、影响推理性能参数

1、神经网络参数

在这里插入图片描述

2、设备参数

CPU通常支持所有的数据格式，如果不是原生的则使用软件进行相应转换。但是GPU、VPU等设备的数据格式通常较少，数据格式会影响内存大小和计算能力，在试验前需要确保有足够的内存空间，足以支撑输入图像存放在网络上并保持权重。
设备参数主要三个方面： ①支持的数据格式；② 内存占用率和速度；③计算能力。

3、推理执行参数

在合理地选择网络和设备后就可以处理执行参数了，检查推理性能的最佳工具是benchmark app，该app可以设置推理引擎所有参数和选项开关，可支持C++/Python，性能指标表现良好。
在这里插入图片描述

1）同步/异步执行

同步执行：推理有时需要很长时间，该模式下需要等待流水线完成每个阶段，这样会降低整体系统性能，无法充分发挥每个部分的最大性能。
异步执行：只发送第一帧的推理请求，而不用等待完成，继续准备第二帧，在推理请求没有阻塞时，不断准备帧进行输入，并进行推理操作，该模式可以实现吞吐量的巨大提升。
在这里插入图片描述