ONNX模型解析推理工具onnx-parser使用记录

156 篇文章 17 订阅
104 篇文章 8 订阅

onnx-parser是国内开发者开发的一个ONNX网络模型解析以及推理工具,当前已经被纳入了RT-Thread的开发包,由于RT-Thread的ENV环境支持,下面分析记录一下它的使用和原理分析。

首先下载代码:

git clone https://github.com/wuhanstudio/onnx-parser

下载Scons工具

Scons是一个开放源码、以Python语言编码的自动化构建工具。可以将SCons看作是经典Make实用程序的改进的、跨平台的替代品.

修改编译错误:

代码下载下来,默认是编译不过的,会出现下面的错误:

解决方式是修改其中的 onnx.pb-c.h实现:

diff --git a/onnx.pb-c.h b/onnx.pb-c.h
index 0fe2a2e..22a76f2 100644
--- a/onnx.pb-c.h
+++ b/onnx.pb-c.h
@@ -4,7 +4,7 @@
 #ifndef PROTOBUF_C_src_2fonnx_2eproto__INCLUDED
 #define PROTOBUF_C_src_2fonnx_2eproto__INCLUDED
 
-#include <protobuf-c.h>
+#include <protobuf-c/protobuf-c.h>
 
 PROTOBUF_C__BEGIN_DECLS
 

编译:

进入到example目录下:

​caozilong@caozilong-Vostro-3268:~/Workspace/onnx/onnx-parser/example$ scons 
scons: Reading SConscript files ...

scons: warning: Two different environments were specified for target /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o,
	but they appear to have the same action: $CC -o $TARGET -c $CFLAGS $CCFLAGS $_CCCOMCOM $SOURCES
File "/home/caozilong/Workspace/onnx/onnx-parser/example/SConstruct", line 18, in <module>

scons: warning: Two different environments were specified for target /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o,
	but they appear to have the same action: $CC -o $TARGET -c $CFLAGS $CCFLAGS $_CCCOMCOM $SOURCES
File "/home/caozilong/Workspace/onnx/onnx-parser/example/SConstruct", line 18, in <module>

scons: warning: Two different environments were specified for target /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o,
	but they appear to have the same action: $CC -o $TARGET -c $CFLAGS $CCFLAGS $_CCCOMCOM $SOURCES
File "/home/caozilong/Workspace/onnx/onnx-parser/example/SConstruct", line 18, in <module>
scons: done reading SConscript files.
scons: Building targets ...
gcc -o backend/add.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/add.c
gcc -o backend/conv2d.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/conv2d.c
gcc -o backend/dense.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/dense.c
gcc -o backend/info.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/info.c
gcc -o backend/matmul.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/matmul.c
gcc -o backend/maxpool.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/maxpool.c
gcc -o backend/model.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/model.c
gcc -o backend/relu.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/relu.c
gcc -o backend/softmax.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/softmax.c
gcc -o backend/transpose.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend backend/transpose.c
gcc -o mnist/mnist.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend mnist/mnist.c
gcc -o mnist/mnist_model.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend mnist/mnist_model.c
gcc -o mnist/mnist_sm.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend mnist/mnist_sm.c
gcc -o /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.c
gcc -o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.c
gcc -o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.c
gcc -o onnx-mnist /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o mnist/mnist.o backend/add.o backend/conv2d.o backend/dense.o backend/info.o backend/matmul.o backend/maxpool.o backend/model.o backend/relu.o backend/softmax.o backend/transpose.o -lm
gcc -o onnx-mnist-model /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o mnist/mnist_model.o backend/add.o backend/conv2d.o backend/dense.o backend/info.o backend/matmul.o backend/maxpool.o backend/model.o backend/relu.o backend/softmax.o backend/transpose.o -lm
gcc -o onnx-mnist-sm /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o mnist/mnist_sm.o backend/add.o backend/conv2d.o backend/dense.o backend/info.o backend/matmul.o backend/maxpool.o backend/model.o backend/relu.o backend/softmax.o backend/transpose.o -lm
gcc -o parse/parse_test.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend parse/parse_test.c
gcc -o onnx-parser /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o parse/parse_test.o
gcc -o transpose/transpose_test.o -c -I. -I/home/caozilong/Workspace/onnx/onnx-parser -Ibackend transpose/transpose_test.c
gcc -o onnx-transpose /home/caozilong/Workspace/onnx/onnx-parser/onnx-parser.o /home/caozilong/Workspace/onnx/onnx-parser/onnx.pb-c.o /home/caozilong/Workspace/onnx/onnx-parser/protobuf-c.o transpose/transpose_test.o backend/transpose.o backend/info.o -lm
scons: done building targets.
caozilong@caozilong-Vostro-3268:~/Workspace/onnx/onnx-parser/example$ 

验证:

./onnx-parser mnist-sm.onnx

./onnx-mnist

./onnx-mnist-sm 

 ./onnx-mnist-model

backend目录中包含了算子的实现

另外一个算子库:

git clone https://github.com/wuhanstudio/onnx-backend

caozilong@caozilong-Vostro-3268:~/Workspace/onnx/onnx-backend$ tree
.
├── examples
│   ├── mnist.c
│   ├── mnist.h
│   ├── mnist_model.c
│   ├── mnist_sm.c
│   └── model
│       ├── mnist-keras.ipynb
│       ├── mnist-lg.onnx
│       └── mnist-sm.onnx
├── README.md
├── SConscript
└── src
    ├── add.c
    ├── conv2d.c
    ├── dense.c
    ├── info.c
    ├── matmul.c
    ├── maxpool.c
    ├── model.c
    ├── onnx.h
    ├── relu.c
    ├── softmax.c
    └── transpose.c

3 directories, 20 files
caozilong@caozilong-Vostro-3268:~/Workspace/onnx/onnx-backend$

网络模型结构:


程序打印出来的网络结构: 


规律,输入图像都进行了归一化

结束!

  • 11
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
可以使用 ONNX Runtime 的 API 来删除 ONNX 模型中的多余节点,并将其导出为 TensorRT 引擎。以下是一些步骤: 1. 加载 ONNX 模型 首先,使用 ONNX Runtime 的 Python API 加载 ONNX 模型。可以使用以下代码: ```python import onnx import onnxruntime as ort # Load the ONNX model onnx_model = onnx.load("model.onnx") ``` 2. 删除多余节点 使用 ONNX Runtime 的 API,可以轻松删除 ONNX 模型中的多余节点。可以使用以下代码: ```python # Create a new ONNX model without the unnecessary nodes inputs = ["input_0"] outputs = ["output_0"] new_model = ort.quantization.quantize_dynamic(onnx_model, inputs=inputs, outputs=outputs) ``` 在这个例子中,我们使用 ONNX Runtime 的 `quantize_dynamic` API 来删除模型中的多余节点。我们还指定了输入和输出节点的名称。 3. 导出 TensorRT 引擎 使用 TensorRT 的 ONNX Parser,可以将 ONNX 模型解析为 TensorRT 的网络表示形式。可以使用以下代码将新的 ONNX 模型导出为 TensorRT 引擎: ```python import tensorrt as trt # Create a TensorRT builder builder = trt.Builder(TRT_LOGGER) # Create a TensorRT network from the ONNX model network = builder.create_network() parser = trt.OnnxParser(network, TRT_LOGGER) parser.parse_from_string(new_model.SerializeToString()) # Build an engine from the TensorRT network engine = builder.build_cuda_engine(network) ``` 在这个例子中,我们使用 TensorRT 的 Python API 创建一个 TensorRT builder 和一个 TensorRT network。然后,使用 TensorRT 的 ONNX Parser 将新的 ONNX 模型解析为 TensorRT 的网络表示形式,并将其添加到 TensorRT network 中。最后,使用 TensorRT builder 构建一个 TensorRT 引擎。 注意,这个例子中使用的是 `parse_from_string` 方法来解析 ONNX 模型。这是因为我们已经使用 ONNX Runtime 对模型进行了修改。如果您没有修改模型,则可以使用 `parse` 方法来解析原始 ONNX 模型。 4. 运行 TensorRT 引擎 构建完 TensorRT 引擎后,可以使用与前面例子中相同的代码来运行 TensorRT 推理。 ```python import pycuda.driver as cuda import pycuda.autoinit import numpy as np # Load the engine with open("engine.plan", "rb") as f: engine_data = f.read() engine = runtime.deserialize_cuda_engine(engine_data) # Allocate input and output buffers on the GPU input_bindings = [] output_bindings = [] stream = cuda.Stream() for binding in engine: size = trt.volume(engine.get_binding_shape(binding)) * engine.max_batch_size dtype = trt.nptype(engine.get_binding_dtype(binding)) if engine.binding_is_input(binding): input_bindings.append(cuda.mem_alloc(size * dtype.itemsize)) else: output_bindings.append(cuda.mem_alloc(size * dtype.itemsize)) # Load input data to the GPU input buffer input_data = np.random.randn(batch_size, input_size) cuda.memcpy_htod(input_bindings[0], input_data.flatten().astype(np.float32)) # Run inference context = engine.create_execution_context() context.execute_async_v2(bindings=input_bindings + output_bindings, stream_handle=stream.handle) cuda.streams.synchronize() # Get the output data from the GPU output buffer output_data = np.empty((batch_size, output_size), dtype=np.float32) cuda.memcpy_dtoh(output_data.flatten(), output_bindings[0]) ``` 在这个过程中,首先使用 TensorRT 的 Python API 加载 TensorRT 引擎。然后,使用 PyCUDA 分配输入和输出缓冲区,并将输入数据从主机(CPU)传输到设备(GPU)。接下来,使用 TensorRT 的 Python API 创建一个 TensorRT 执行上下文,并在 GPU 上异步执行 TensorRT 推理。最后,使用 PyCUDA 将输出数据从设备(GPU)传输到主机(CPU)。 这就是如何使用 ONNX Runtime API 删除 ONNX 模型中的多余节点,并将其导出为 TensorRT 引擎。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

papaofdoudou

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值