使用tensorrt自带的trtexec将onnx模型转换为trt模型

最新推荐文章于 2024-07-21 18:39:00 发布

lgh15897723511

最新推荐文章于 2024-07-21 18:39:00 发布

阅读量1.8k

点赞数

文章标签： TensorRT ONNX 模型转换 Ubuntu 动态链接库

本文链接：https://blog.csdn.net/lgh15897723511/article/details/127847344

版权

1.在官网下载好tensorrt，进入bin目录。（注意：在ubuntu上需要加上sudo,使用管理员权限。）

运行如下模型转换命令：

sudo ./trtexec --onnx=model_res512672_best.onnx --saveEngine=model_res512672_best.trt --workspace=1024 --iterations=1 --verbose

--workspace = 1024 以兆字节为单位设置工作区大小（默认 = 16）

--iterations = 1 运行至少 N 次推理迭代（默认 = 10）

--verbose 使用详细日志记录 (默认 = false)

（注意：设置--workspace时需要先查看系统可用的内存。）

结果1：如果报错。需要尝试在/tensorrt/bin 目录下添加几个动态链接库。

例如在windows上：

加上：myelin64_1.dll；nvinfer.dll；nvinfer_plugin.dll；nvonnxparser.dll；nvparsers.dll。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lgh15897723511

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
使用tensorrt自带的trtexec将onnx模型转换为trt模型

使用tensorrt自带的trtexec将onnx模型转换为trt模型
复制链接

扫一扫

TensorRT用自带trtexec实现onnx转engine的用法说明

qq_33287871的博客

08-01

4479

TensorRT自带的trtexec在bin目录下，是一个可执行文件。运行./trtexec -h 其中给出了 model options、build options、 inference options和system options等。上次我们使用TensorRT的pyhton API进行序列化模型和前向推理，这次介绍使用trtexec转模型。 1.从固定尺寸的onnx转cudaEngine ./trtexec --explicitBatch --onnx=./resnet50.onnx --sa

pytorch 将onnx模型转换为trt TensorRT模型

03-20

适用于TensorRT8.0版本及以上使用步骤 1、chmod 添加文件执行权限 2、将onnx路径修改为自己的onnx模型路径 3、运行py问价

1 条评论您还未登录，请先登录后发表或查看评论

在ubuntu系统中使用TensorRT出现trtexec: command not found

MMMMMMNONG的博客

06-14

356

使用trtexec报错

trtexec将onnx转换成engine的时候报错Uncaught exception detected: Unable to open library: nvinfer_plugin.dll

最新发布

qq_42042528的博客

07-21

341

trtexec将onn转换成engin的时候报错Uncaught exception detected: Unable to open library: nvinfer_plugin.dll

onnx转trt方法

weixin_67615387的博客

01-31

2572

onnx转TensorRT

使用trtexec将onnx生成trt

qq_37408085的博客

11-11

3962

#生成静态batchsize的engine ./trtexec --onnx=<onnx_file> \ --explicitBatch \ --saveEngine=<tensorRT_engine_file> \ --workspace=<size_in_megabytes> \ --fp16 #生成动态batchsize的engi.

Windows环境使用TensorRT工具trtexec将ONNX转换为engine(trt)文件

P_Leung的技术博客

09-28

7078

当前环境软件版本 CUDA 10.2 cudnn 7.6.5 TensorRT 7.0.0.11 根据当前环境编译trtexec 源码在TensorRT里面，路径TensorRT-7.0.0.11\samples\trtexec 1. 使用Visual Studio打开项目打开trtexec.sln文件 2. 给项目配置正确的头文件和静态库路径头文件右键解决方案属性=> C/C++ => 常规 => 附加包含目录添加以下路径(根据自身情况

onnx模型转为trt模型

weixin_42156097的博客

10-28

1910

想要加速推理速度，一定要用半精度/混合精度，即（-d 16)

使用trtexec工具多batch推理tensorrt模型(trt模型)

Thomas_Cai的记忆殿堂

07-06

2147

/XXX/TensorRT-8.2.5.1/bin 注意：得到：

基于python的tensorrt int8 量化yolov5 onnx模型实现

03-26

在TensorRT中，INT8量化是一种常用的模型优化技术，它通过将模型的计算从浮点精度（通常为FP32）转换为8位整数，显著减少了内存需求和推理时间，同时在许多情况下仍能保持良好的精度。量化过程包括两个主要步骤：...

TensorRT-使用TensorRT部署Pytorch版YOLOv4-通过Pytorch2onnx导出onnx模型转TRT部署

02-27

在本文中，我们将深入探讨如何使用TensorRT进行PyTorch版本的YOLOv4模型的部署，通过PyTorch到ONNX的转换，以及进一步将ONNX模型优化为TensorRT执行引擎。这是一个高效的算法部署实践，对于提升目标检测速度和性能...

yolov3-tiny-onnx-TensorRT:将您的yolov3-tiny模型转换为trt模型

05-12

yolov3-tiny2onnx2trt 将您的yolov3-tiny模型转换为trt模型设备：nvidia jetson tx2 jetpack版本：jetpack4.2： ubuntu18.04 tensorrt5.0.6.3 cuda10.0 cudnn7.3.1 其他： python=2.7 numpy=1.16.1 onnx=1.4.1 (important) pycuda=2019.1.1 Pillow=6.1.0 wget=3.2 自定义设置 data_processing.py: line14: LABEL_FILE_PATH = '/home/nvidia/yolov3-tiny2onnx2trt/coco_labels.txt' line19: CATEGORY_NUM = 80 yolov3_to_onnx.py: line778: img_siz

yolov5训练以及模型onnx转换

10-13

目标检测工程备份

onnx-tensorrt：ONNX-TensorRT：ONNX的TensorRT后端

02-05

解析ONNX模型以使用执行。另请参阅。有关最近更改的列表，请参见。有关常见问题的列表，请参见。支持的TensorRT版本 Master分支上的开发适用于具有完整尺寸和动态形状支持的的最新版本。对于TensorRT的...

Pytorch通过保存为ONNX模型转TensorRT5的实现

09-16

然而，在生产环境中，为了达到更高的性能，通常需要将模型转换为更高效的格式，如 ONNX 和 TensorRT。ONNX (Open Neural Network Exchange) 是一种开放格式，用于表示机器学习模型，它支持多种深度学习框架之间的...

TensorRT8——ONNX转trt

xiaohu的博客

04-28

5457

CUDA安装首先需要确保正确安装CUDA，安装后通过nvcc -V验证是否安装。下载TensorRT https://developer.nvidia.com/nvidia-tensorrt-8x-download

TensorRT - 使用trtexec工具转换模型、运行模型、测试网络性能

热门推荐

HW140701的博客

09-21

1万+

1 转换模型 1.1 Caffe模型转换为TensorRT模型将Caffe模型转换为TensorRT模型，启动所有精度以达到最佳性能 trtexec --deploy=mnist.prototex --model=mnist.caffe --saveEngine=mnist.trt --best 将Caffe模型转换为TensorRT模型，启动所有精度以达到最佳性能，并跳过推理性能测试 trtexec --deploy=mnist.prototex --model=mnist.caffe --s

使用python进行onnx转trt（TensorRT）模型，简单有效

Fenplan的博客

07-24

5149

运行环境 python 3.6.9 tensorrt 7.1.3.4 简单代码实现 import tensorrt as trt import sys import os TRT_LOGGER = trt.Logger(trt.Logger.WARNING) EXPLICIT_BATCH = 1 << (int)(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH) def printShape(engine): for i in r.

onnx 模型导出为 trt 模型

先说一下，就简单地写点儿氵文，不是博客，只是我的笔记本/工具书

07-18

4197

onnx -> trt

我想使用tensorrt8来推理onnx模型，请给出代码

04-23

好的，以下是使用TensorRT 8对ONNX模型进行推理的Python代码示例： ```python import tensorrt as trt import numpy as np # Load ONNX model onnx_model_path = "/path/to/onnx/model.onnx" onnx_encoder = trt.OnnxParser(trt.Logger(trt.Logger.WARNING)) onnx_encoder.parse(open(onnx_model_path, 'rb').read()) # Set TensorRT builder parameters builder = trt.Builder(trt.Logger(trt.Logger.WARNING)) builder.max_workspace_size = 1 << 20 builder.max_batch_size = 1 # Set input and output shapes input_shape = (1, 3, 224, 224) output_shape = (1, 1000) builder.fp16_mode = True builder.strict_type_constraints = True network = builder.create_network() input_tensor = network.add_input(name="input", dtype=trt.float32, shape=input_shape) output_tensor = network.add_output(name="output", dtype=trt.float32, shape=output_shape) # Add ONNX model to TensorRT network onnx_tensor = {} for i in range(onnx_encoder.num_outputs): onnx_tensor[onnx_encoder.get_output_name(i)] = network.add_output( name=onnx_encoder.get_output_name(i), dtype=trt.float32, shape=onnx_encoder.get_output_shape(i)) onnx_tensor.update( {onnx_encoder.get_input_name(i): network.add_input( name=onnx_encoder.get_input_name(i), dtype=trt.float32, shape=onnx_encoder.get_input_shape(i)) for i in range(onnx_encoder.num_inputs)}) # Build TensorRT engine engine = builder.build_cuda_engine(network) context = engine.create_execution_context() # Generate random input data input_data = np.random.rand(*input_shape).astype(np.float32) # Allocate device memory for input and output data d_input = cuda.mem_alloc(input_data.nbytes) d_output = cuda.mem_alloc(output_shape[0] * np.dtype(np.float32).itemsize) # Copy input data to device memory cuda.memcpy_htod(d_input, input_data) # Do inference context.execute(1, [int(d_input), int(d_output)]) # Copy output data from device memory output_data = np.empty(output_shape, dtype=np.float32) cuda.memcpy_dtoh(output_data, d_output) # Print output data print(output_data) ``` 请注意，此示例假定您已经正确安装了TensorRT 8并且已经添加了必要的路径。如果您需要更多帮助，请参阅TensorRT文档和示例。