onnx优化系列 - 获取中间Node的inference shape的方法

最新推荐文章于 2024-07-18 23:16:17 发布

Artyze

最新推荐文章于 2024-07-18 23:16:17 发布

阅读量1w

点赞数 9

分类专栏：模型转换文章标签： tensorflow pytorch caffe 编辑器

本文链接：https://blog.csdn.net/Artyze/article/details/107403191

版权

模型转换专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何使用ONNX的shape_inference模块获取模型中间节点的形状信息，这对于理解模型内部工作原理及优化至关重要。文章详细展示了通过修改输入张量、添加权重信息并运行形状推断的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

需求描述

很多时候发现通过tensorflow或者pytorch转过来的模型是没有中间的node的shape的，比如下面这样：
原始模型
但是碰到一些很奇怪的算子的时候，我们又想知道他对上一层feature map的形状影响是怎样的，于是下面的模型看起来会更友好一些
带中间shape的模型
这里之所以看上去和原来的node的分布都不一样，是因为我在这里将pad和biasadd加到conv中了已经。

原理

ONNX本身提供了进行inference的api：

shape_inference.infer_shapes()

但是呢，这里进行inference并不是根据graph中的tensor，而是根据graph的input中各个tensor的tensor_value_info。所以我们需要做的就是根据各个tensor的信息创建出对应的tensor_value_info之后将其append进graph.inputs即可。

最开始我进行infer_shapes之后发现没用就是因为graph.inputs中的tensor_value_info只有input node的。

代码

import onnx
from onnx.tools import update_model_dims
import numpy as np
import onnx.helper as helper
from onnx import shape_inference, TensorProto
import sys

ONNX_DTYPE = {
    0: TensorProto.FLOAT,
    1: TensorProto.FLOAT,
    2: TensorProto.UINT8,
    3: TensorProto.INT8,
    4: TensorProto.UINT16,
    5: TensorProto.INT16,
    6: TensorProto.INT32,
    7: TensorProto.INT64,
    8: TensorProto.STRING,
    9: TensorProto.BOOL
}

# load model
onnx_model = onnx.load("tf_resnet_v2_50_onnx.onnx")
graph = onnx_model.graph

# rewrite the input tensor of graph
input_tensor = graph.input[0]
input_shape = input_tensor.type.tensor_type.shape.dim
input_tensor_new = onnx.helper.make_tensor_value_info(name = input_tensor.name, elem_type = 1, 
                                                      shape = [1, input_shape[1].dim_value, input_shape[2].dim_value, input_shape[3].dim_value])
graph.input.remove(input_tensor)
graph.input.insert(0, input_tensor_new)

# append all tensor infos to graph input
weight_infos = []
tensors = graph.initializer
for i, tensor in enumerate(tensors):
    value_info = helper.make_tensor_value_info(tensor.name, ONNX_DTYPE[tensor.data_type], tensor.dims)
    weight_infos.append(value_info)
    graph.input.insert(i+1, value_info) # because 0 is for placeholder, so start index is 1

# run node shape inference
node = graph.node
value_info = graph.value_info
print("Before shape inference: \n")
print(value_info)
print("------------------------------------------------------------")
print("After shape inference: \n")
inferred_onnx_model = shape_inference.infer_shapes(onnx_model)
onnx.checker.check_model(onnx_model)
inferred_graph = inferred_onnx_model.graph
inferred_value_info = inferred_graph.value_info
print(inferred_value_info)
onnx.save(inferred_onnx_model,"./new.onnx")