Pytorch转onnx并部署

最新推荐文章于 2024-06-21 21:09:27 发布

IFT_jason

最新推荐文章于 2024-06-21 21:09:27 发布

阅读量1.4k

点赞数

分类专栏： Pytorch onnx onnxruntime

本文链接：https://blog.csdn.net/infinite_jason/article/details/117660030

版权

Pytorch 同时被 3 个专栏收录

2 篇文章 1 订阅

订阅专栏

onnx

1 篇文章 0 订阅

订阅专栏

onnxruntime

1 篇文章 0 订阅

订阅专栏

训练好一个模型，或找到开源模型后，转为onnx并通过onnxruntime（CPU，GPU）来部署服务。

Pytorch模型转为onnx可参考此文档。

文档缺少了一些内容，下面就按照自己的实践经验再整理一遍。

首先，准备训练好的Pytorch模型，将模型通过model.eval()转为推理模式。detect_model：为举例用的网络。

import torch

model_path = "model/path"
model_weights = torch.load(model_path)
model = detect_model().to(device)
model.load_state_dict(model_weights)
model.eval()

转换之前需要指定输入参数。很多网络都是需要动态指定输入参数的。文档中提到了如何动态调整batch_size，以下代码是如何动态指定输入的宽高。

batch_size = 1
x = torch.randn(batch_size, 3, 320, 640, requires_grad=True).to(device)
torch_out = torch_model(x)

torch.onnx.export(torch_model, x, "detect.onnx",
                      export_params=True, opset_version=10,
                      input_names=['input'],
                      output_names=['output'],
                      dynamic_axes={
                          'input': [2, 3],
                          'output': [2, 3]
                      })

可通过代码来验证，转换是否成功

import onnx

onnx_model = onnx.load("detect.onnx")
onnx.checker.check_model(onnx_model)

转换为onnx模型后，需要使用onnxruntime来运行模型。

import onnxruntime

ort_session = onnxruntime.InferenceSession("detect.onnx")

def to_numpy(tensor):
    return tensor.detach().cpu().numpy() if tensor.requires_grad else tensor.cpu().numpy()

# compute ONNX Runtime output prediction
ort_inputs = {ort_session.get_inputs()[0].name: to_numpy(x)}
ort_outs = ort_session.run(None, ort_inputs)

如果想调用GPU资源，需要卸载onnxruntime，并根据cuda版本安装正确的onnxruntime-gpu。并将上方代码修改为：

import onnxruntime

ort_session = onnxruntime.InferenceSession("detect.onnx")
ortvalue = onnxruntime.OrtValue.ortvalue_from_numpy(x, 'cuda', 0)

def to_numpy(tensor):
    return tensor.detach().cpu().numpy() if tensor.requires_grad else tensor.cpu().numpy()

ort_inputs = {ort_session.get_inputs()[0].name: ortvalue}
ort_outs = ort_session.run(None, ort_inputs)