onnx模型转为trt模型

最新推荐文章于 2024-03-25 06:00:04 发布

绿竹巷人

最新推荐文章于 2024-03-25 06:00:04 发布

阅读量1.6k

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_42156097/article/details/127571229

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

命令

想要加速推理速度，一定要用半精度/混合精度，即（-d 16)

onnx2trt decode.onnx -o decode.trt -b 1 -d 16

错误

把onnx模型转TensorRT模型的trt模型时，报错

[2022-10-28 05:53:29 WARNING] /home/chen/CodeBase/onnx-tensorrt/onnx2trt_utils.cpp:362: Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32.

解决

安装onnx-simplifier

pip install onnx-simplifier

假设你想转换的模型是decode.onnx，先用如下命令转成decode_simple.onnx

python -m onnxsim decode.onnx decode_simple.onnx

接下来将新生成的decode_simple.onnx模型正常转换为trt模型即可

onnx2trt decode_simple.onnx -o decode.trt -b 1 -d 16

补充

执行命令python -m onnxsim decode.onnx decode_simple.onnx过程中我提示了这个错误

ModuleNotFoundError: No module named 'onnxruntime'

安装一下就好了

pip install onnxruntime

关注博主即可阅读全文

优惠劵

绿竹巷人

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
onnx模型转为trt模型

想要加速推理速度，一定要用半精度/混合精度，即（-d 16)
复制链接

扫一扫

专栏目录

pointnet++模型(带控制流)的pytorch转化onnx流程记录

02-28

pointnet++模型(带控制流)的pytorch转化onnx流程记录

TensorRT-使用TensorRT部署Pytorch版YOLOv4-通过Pytorch2onnx导出onnx模型转TRT部署

02-27

TensorRT_使用TensorRT部署Pytorch版YOLOv4_通过Pytorch2onnx导出onnx模型转TRT部署_算法部署_算法优化_优质项目实战

参与评论您还未登录，请先登录后发表或查看评论

onnx | 把onnx模型转trt报错：Your ONNX model has been generated with INT64 weights. while TensorRT

热门推荐

求真、务实

07-31

2万+

欢迎大家关注笔者，你的关注是我持续更博的最大动力原创文章，转载告知，盗版必究把onnx模型转TensorRT模型的trt模型报错：[TRT] onnx2trt_utils.cpp:198: Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32. 文章目录：1 错误原因分析2 错误..

onnx转换tensorrt的两种方法

weixin_42476942的博客

02-08

2万+

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、tensorrt是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、tensorrt是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤 1.引入

ONNX模型转TRT部署推理c++

MAX的专栏

04-21

1838

训练好的模型（如.pt）转成onnx形式，ONNX定义了一组与环境和平台无关的标准格式。ONNX文件不仅存储了神经网络模型的权重，还存储了模型的结构信息、网络中各层的输入输出等一些信息。ONNX的推理可以用ONNX Runtime官方库，如果在英伟达平台上，可以转TensorRT后运行。本文主要介绍转TRT格式后如何C++部署运行。

TensorRT8——ONNX转trt

xiaohu的博客

04-28

5090

CUDA安装首先需要确保正确安装CUDA，安装后通过nvcc -V验证是否安装。下载TensorRT https://developer.nvidia.com/nvidia-tensorrt-8x-download

yolov3_tiny.onnx转trt采用tensorrt加速模型推理

weixin_38106878的博客

05-26

4486

既然上一篇博客都把yolov3-tiny.weights转onnx做了，推理也测了。那么呢，就再直接转个trt模型吧。这样感觉博客的内容就更加连贯了吧，实用性貌似会更加强吧。（如果没看过yolov3-tiny转onnx这篇博客的，请点这，带你飞过去）这篇博客的内容是接着上一篇博客写的，所以呢，这里就直接进入主题，上代码！！本文的目录： onnx模型转trt文件（yolov3-tiny.onnx）；实用tensorrt进行推理；测试推理效果（视频文件）；首先呢，你得要安装好tensorrt，至

onnx转换TensorRT的步骤

weixin_55035144的博客

10-10

1083

在onnx-parser中一旦模型parser解析完成，network就自动填好了，成为了serialized network。builder.create_optimization_profile()：创建用于dynamic shape输入的配置器。创建network（计算图）是API独需的因为其他两种方法使用parser从onnx导入，不用一层层添加。模型搭建的入口，网络的trt内部表示和引擎都是builder的成员方法生成的。已有的trt不适配，需要将onnx转为trt。推理引擎，可执行的代码段。

ModuleNotFoundError: No module named ‘onnxruntime‘和ModuleNotFoundError: No module named ‘onnx‘

生活如此美好，致敬每一个热爱“热爱”的人！

03-31

2万+

D:\programfiles\miniconda\envs\py38torch_gpu\python.exe C:/Users/liqiang/Desktop/handpose_x-master/onnx_inference.py Traceback (most recent call last): File "C:/Users/liqiang/Desktop/handpose_x-master/onnx_inference.py", line 7, in <module> ...

yolov5模型转换为TensorRT模型时报错Your ONNX model has been generated with INT64 weights

liguiyuan的博客

03-14

2730

因为我们的onnx模型参数类型是INT64, 然后TensorRT是不支持 INT64的。这就需要我们先把ONNX模型的精度降到 INT32，然后再进行转换为 TensorRT模型。

onnx-simplifier 模型简化中报错处理

yyc1820252161的博客

04-18

1791

报错1：Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32 报错2：RuntimeError: The shape of input "input_1" has dynamic size "[0, 0, 0, 3]"

onnx转trt模型推理

04-30

ONNX是一种用于表示机器学习模型的可移植格式。 TensorRT是一种用于深度学习推理的高性能推理引擎。因此，将ONNX模型转换为TRT模型可以提高模型的推理速度和准确性。 ONNX转TRT模型的推理需要以下步骤： 1. 加载ONNX模型：使用ONNX运行时库加载ONNX模型。 2. 创建TRT模型：根据ONNX模型的输入和输出张量的形状，创建TRT模型，这也被称为“构建引擎”。 3. 优化TRT模型：通过执行一系列优化步骤，例如网络剪枝、层融合和内存优化，可以提高TRT模型的性能和精度。 4. 执行TRT模型：将优化的TRT模型输入待执行的数据，并执行它。TRT在GPU上执行数据是高速的，通常比在CPU上执行要快。 ONNX到TRT的转换可以使用TensorRT Python API完成。 TensorRT Python API提供了所有必要的功能来加载、构建、优化和执行TRT模型。一般来说，转换的过程比较简单，只需要几行代码即可。但是，在实际应用中，每个模型都是不同的，可能需要了解不同的参数调优机制，才能使TRT模型表现最佳。总之，将ONNX转换为TRT可以获得更快的推理速度和更高的准确性，是加速深度学习推理的有效手段。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交