ONNX笔记

lyyiangang

已于 2022-11-30 09:53:12 修改

阅读量2.8k

点赞数 2

分类专栏：视觉算法文章标签： pytorch 深度学习

于 2022-03-15 19:42:12 首次发布

本文链接：https://blog.csdn.net/lyyiangang/article/details/123507909

版权

视觉算法专栏收录该内容

40 篇文章

订阅专栏

本文介绍了如何使用PyTorch导出ONNX模型后，通过onnx的simplify功能简化模型，并详细讲解了模型结构、节点操作及onnx模型的分割技巧。通过Shufflenet示例，展示了如何处理模型节点和输出，以及官方API进行模型分割的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

使用pytorch转onnx模型后经常需要做下simplify，经过simplify后的模型更加简洁，其底层实现原理就是通过读取onnx模型，再将一些需要动态计算的值转换为静态值，从而对模型进行简化。这里顺便就记下onnx的一下操作。

测试代码

import onnx
import io
import torchvision as tv
import torch.nn as nn
import torch

def test():
    with io.BytesIO() as fid:
        m = tv.models.shufflenet_v2_x1_0()
        x = torch.rand((1, 3, 224, 224))
        torch.onnx.export(m, x, fid)
        torch.onnx.export(m, x, 'test.onnx')
        onnx_model = onnx.load_model_from_string(fid.getvalue()) # onnx_model type: 'onnx.onnx_ml_pb2.GraphProto'
        # import ipdb;ipdb.set_trace()

Graph

onnx_model[onnx.onnx_ml_pb2.ModelProto]
     	opset_import
    	ir_version
     	graph[onnx.onnx_ml_pb2.GraphProto]
     			initializer
     			name
     			input[ValueInfo[]]
     			output[ValueInfo[]]
     			node[Node[]]
     			value_info[空]

graph.input/output
graph.input是一个valueinfo类型的数据，顾名思义，这是个包含了输入相关的数值信息，如下所示，可以看出m.graph.input保存了输入的图片尺寸[1, 3, 224, 224]

ipdb> m.graph.input
[name: "input.1"
type {
  tensor_type {
    elem_type: 1
    shape {
      dim {
        dim_value: 1
      }
      dim {
        dim_value: 3
      }
      dim {
        dim_value: 224
      }
      dim {
        dim_value: 224
      }
    }
  }
}
]

ipdb> m.graph.output
[name: "1044"
type {
  tensor_type {
    elem_type: 1
    shape {
      dim {
        dim_value: 1
      }
      dim {
        dim_value: 1000
      }
    }
  }
}
]

比较详细的定义如下：
在这里插入图片描述

Node

node包含以下属性：

Node
	 attribute[Attribute[]]
	 doc_string
	 domain[string]
	 name[string]
	 op_type[string]
	 input[string[]]
	 output[string[]]

node的input必须是上一个节点的output，或者是graph.input或initializer,
下面打印的第一个节点的input就是graph的input(“input.1”), 第二个节点是第一个节点的output（1045）

ipdb> nn = m.graph.node[0]
ipdb> nn
input: "input.1"
input: "1046"
input: "1047"
output: "1045"
name: "Conv_0"
op_type: "Conv"
attribute {
  name: "dilations"
  ints: 1
  ints: 1
  type: INTS
}
attribute {
  name: "group"
  i: 1
  type: INT
}
attribute {
  name: "kernel_shape"
  ints: 3
  ints: 3
  type: INTS
}
attribute {
  name: "pads"
  ints: 1
  ints: 1
  ints: 1
  ints: 1
  type: INTS
}
attribute {
  name: "strides"
  ints: 2
  ints: 2
  type: INTS
}
## 第二个节点输入是1045，也就是前一个节点的output
ipdb> node[1]
input: "1045"
output: "341"
name: "Relu_1"
op_type: "Relu"

在这里插入图片描述
注意input和output是value_info，不会包含在graph.node中。
每个node输出会成为下一个node的输入， node与node之间使用input/output链接。
构建过程大致如下：
valueinfo -> node -> graph -> model.

一个model可包含多个graph
一个graph包含多个node
一个node可以包含多个output/input(valueinfo).
下面展示下如何创建一个graph。

import onnx
from onnx import helper
from onnx import AttributeProto, TensorProto, GraphProto


# The protobuf definition can be found here:
# https://github.com/onnx/onnx/blob/main/onnx/onnx.proto


# Create one input (ValueInfoProto)
X = helper.make_tensor_value_info("X", TensorProto.FLOAT, [3, 2])
pads = helper.make_tensor_value_info("pads", TensorProto.FLOAT, [1, 4])

value = helper.make_tensor_value_info("value", AttributeProto.FLOAT, [1])


# Create one output (ValueInfoProto)
Y = helper.make_tensor_value_info("Y", TensorProto.FLOAT, [3, 4])

# Create a node (NodeProto) - This is based on Pad-11
node_def = helper.make_node(
    "Pad",                  # name
    ["X", "pads", "value"], # inputs
    ["Y"],                  # outputs
    mode="constant",        # attributes
)

# Create the graph (GraphProto)
graph_def = helper.make_graph(
    [node_def],        # nodes
    "test-model",      # name
    [X, pads, value],  # inputs
    [Y],               # outputs
)

# Create the model (ModelProto)
model_def = helper.make_model(graph_def, producer_name="onnx-example")

print(f"The model is:\n{model_def}")
onnx.checker.check_model(model_def)
print("The model is checked!")

分割onnx模型

有了上面的基础知识，我们就可以进行onnx模型的分割了。以shufflenet为例，如果我们想在下图中Relu位置将模型截取两段，可以参考下面的代码
在这里插入图片描述

def split():
	import onnx
	import io
	import torchvision as tv
    with io.BytesIO() as fid:
        m = tv.models.shufflenet_v2_x1_0()
        x = torch.rand((1, 3, 224, 224))
        torch.onnx.export(m, x, fid)
        onnx_model = onnx.load_model_from_string(fid.getvalue()) # onnx_model type: 'onnx.onnx_ml_pb2.GraphProto'
        del onnx_model.graph.node[2:]
        del onnx_model.graph.output[:]
        onnx_model.graph.output.extend([onnx.ValueInfoProto(name=onnx_model.graph.node[1].output[0])])
        onnx.save(onnx_model, 'split.onnx')

截取后的模型：
在这里插入图片描述

使用官方api分割模型

onnx官方提供了pythonapi 对onnx文件进行编辑。

import onnx

input_path = "path/to/the/original/model.onnx"
output_path = "path/to/save/the/extracted/model.onnx"
input_names = ["input_0", "input_1", "input_2"]
output_names = ["output_0", "output_1"]

onnx.utils.extract_model(input_path, output_path, input_names, output_names)