使用openvino量化onnx模型，pycharm中操作，openvino调用完成推理

原创

已于 2025-03-12 00:34:02 修改 · 1.3k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#openvino #pycharm #人工智能 #性能优化 #python #pytorch #ai

于 2025-03-12 00:31:53 首次发布

一.简单说明

openvino是Intel公司为了加速模型推理而推出的一款工具，对于一些Intel公司的CPU和GPU上运行模型有不错的加速效果。

二.调用库推理

如果要对pycharm导出的pt模型部署到Intel公司的芯片上运行可以使用openvino将模型转化为xml+bin格式的文件再用openvino第三方库来调用推理。

三.主要讲解openvino量化pytoch模型，然后使用openvino调用推理：

1.pycharm中安装openvino

可以直接切换到python环境，运行pip install openvino，推荐最新版，老版本经常改动，很多方法经常变动。
本篇文章以2025.1.0为例来说明。

2.pt文件转onnx

此篇文章不做说明，一般是调用torch.onnx.export此方法转，会生成onnx文件。

3.onnx文件转xml+bin

下面会附上源码，只需要简单调用openvino.runtime里面的Core和serialize即可，注意不要使用from openvino.inference_engine import IECore这种，否则很可能报错。具体原因不想深究，总之我的量化和推理过程不需要用到openvino.inference_engine模块。
代码如下：

from openvino.runtime import Core
from openvino.runtime import serialize

ie = Core()
onnx_model_path = r"../_fp32.onnx"
model_onnx = ie.read_model(model=onnx_model_path)
# compiled_model_onnx = ie.compile_model(model=model_onnx, device_name="CPU")
serialize(model=model_onnx, xml_path="model.xml", bin_path="model.bin",
          version="UNSPECIFIED")