OpenVINO 2022.3之十:OpenVINO™ 中用于推理优化的自适应参数选择

OpenVINO提供了自动批量处理(Auto-batching)、自动插件(AUTOPlugin)和动态形状(DynamicShape)等功能来优化推理性能。Auto-batching在GPU上最大化数据吞吐量,尤其适合大量输入数据。AUTOPlugin自动选择最佳推理设备,而DynamicShape允许模型根据输入动态调整形状。这些特性帮助开发者无需深入硬件细节即可提升AI模型的效率。
摘要由CSDN通过智能技术生成

OpenVINO 2022.3之十:OpenVINO™ 中用于推理优化的自适应参数选择

当你使用 AI 模型进行推理时,OpenVINO™ 提供了一些自动设定参数选项的功能。

常见有以下3个与模型推理相关的功能:

  • 用于 input 数据足够多时,提供最大 throughput 的 Auto-batching 功能;
  • 用于自动选择设备进行推理的 Auto Plugin 功能;
  • 以及用于满足特定模型动态输入的 Dynamic Shape 功能。

1 Auto-batching

Auto-batching 设计目的是让开发者利用最少的代码去实现使用英特尔® 显卡做模型推理的数据吞吐量最大化。在没有设定 input 以及没有限制范围的情况下,它会按照集成显卡或者是独立显卡能承受的最大吞吐量去设定推理线程数。如果应用程序有大量的输入数据且以高频率连续提交推理请求,推荐使用 Auto-batching 功能。

Auto-batching启用:

将“device“参数设置为:“BATCH:GPU“ 该功能将会被激活

./benchmark_app -m <<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

mingo_敏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值