OpenVINO 2022.3之十:OpenVINO™ 中用于推理优化的自适应参数选择
当你使用 AI 模型进行推理时,OpenVINO™ 提供了一些自动设定参数选项的功能。
常见有以下3个与模型推理相关的功能:
- 用于 input 数据足够多时,提供最大 throughput 的 Auto-batching 功能;
- 用于自动选择设备进行推理的 Auto Plugin 功能;
- 以及用于满足特定模型动态输入的 Dynamic Shape 功能。
1 Auto-batching
Auto-batching 设计目的是让开发者利用最少的代码去实现使用英特尔® 显卡做模型推理的数据吞吐量最大化。在没有设定 input 以及没有限制范围的情况下,它会按照集成显卡或者是独立显卡能承受的最大吞吐量去设定推理线程数。如果应用程序有大量的输入数据且以高频率连续提交推理请求,推荐使用 Auto-batching 功能。
Auto-batching启用:
将“device“参数设置为:“BATCH:GPU“ 该功能将会被激活
./benchmark_app -m <<