Jetson nano上使用trt部署自己训练的YOLOv5模型（亲测可用！！）

计算之声

已于 2022-09-16 17:25:53 修改

阅读量2.2k

点赞数 3

于 2022-09-16 17:11:44 首次发布

本文链接：https://blog.csdn.net/m0_38052342/article/details/126893231

版权

YOLOv5 TensorRT 模型优化推理速度部署

关键词由CSDN通过智能技术生成

yolov5的github链接:GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

TensorRT下载链接:tensorrtx/yolov5 at master · wang-xinyu/tensorrtx · GitHub

查看自己使用的yolov5版本

以yolov5s为例，打开文件yolo-master/models/yolov5s.yaml查看yolov5版本

下载trt并导出wts格式模型文件

链接tensorrtx/yolov5 at master · wang-xinyu/tensorrtx · GitHub可查看yolov5对应版本的trt并下载

下载trt得到tensorrtx文件夹，将tensorrtx/yolov5/gen_wts.py拷贝至yolov5项目根目录下

执行命令生成wts文件

python gen_wts.py yolov5/runs/train/exp4/weights/best.pt

运行完毕之后会生成一个.wts文件放到tensorrtx/yolov5/目录下

Ubantu部署

在ubantu上也克隆一个tensorrtx项目

将生成的.wts拷贝到tensorrtx/yolov5/下

修改tensorrtx/yolov5/yololayer.h中

static constexpr int CLASS_NUM = 4; （我自己的类别为4）

在tensorrtx/yolov5/目录下打开终端，编译代码

mkdir build
cd build
cmake ..
make

将.wts文件转为.engine文件

./yolov5 -s ../best.wts ../best.engine s (n/s/m/l/x/n6/s6/m6/l6/x6 or c/c6 gd gw)

执行推理任务

./yolov5 -d ../best.engine ../images

执行完在build目录生成检测完成的图片

使用python推理，编辑tensorrtx\yolov5中的yolov5_trt.py或者yolov5_trt_cuda_python.py使用python推理。

若能帮到您的话，点赞评论吧！！

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

计算之声

关注关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

yolov5的v5版本yolov5m.pt

05-09

yolov5的v5版本yolov5m.pt

目标检测YOLOV5 v7.0（Win11和Ubuntu20.04）

m0_66483112的博客

04-19

1764

对train.py进行修改，主要用到的只有这几个参数而已：–weights，–cfg，–data，–epochs，–batch-size，–img-size，–project；查看yolov5中的detect.py文件，然后将所用的权重下载到根目录中直接执行即可，如果没问题开始训练自己的训练集。（上一步的安装会安装CPU版本的pytorch，如果需要安装GPU版本的pytorch需要另外安装）（有的博客说可以直接下GPU的能覆盖，但是我这里试过不行，所以我先卸载）

参与评论您还未登录，请先登录后发表或查看评论

Yolov5lite 训练模型转trt

canyingfeixue的专栏

07-29

324

【代码】Yolov5lite 训练模型转trt。

YOLOv5~TRT~JetsonNX部署

whaosoft143ai的博客

06-09

641

whaosoft对ResNet常见的两种网络结构ResNet18和ResNet50分别进行了测试，实验结果如图1所示，加速版本与未加速版本所使用的设置均一致，测量的指标为query per second(qps)，batchsize均为1,加速比约为6.02。目前模型部署框架则有NVIDIA推出的TensorRT，谷歌的Tensorflow和用于ARM平台的tflite，开源的caffe，百度的飞桨等。可以将原模型导出为onnx格式，其中model是我们要进行导出的模型文件，f为导出的onnx模型文件。

yolov5_trt_web检索衣服图案

点我

07-05

399

个人原创，github地址：https://github.com/sunanlin13174/deepfashion2-yolov5-trt-sever 此项目受启发于行人重识别，都是利用模型提取的图像特征向量做相似性对比，以此完成图案检索，行人检索的代码在此：https://github.com/sunanlin13174/yolo3_reid 但是，现在深度学习图像检索任务通常分为两个部分，即目标检测和特征提取，需要分别训练两个不同的模型，无疑消耗太大，我们想到基于yolov5一步完成目...

Yolov5的tensorRT加速(python)

Mintary的博客

09-04

1380

Yolov5的tensorRT加速

Jetson nano上部署自己的Yolov5模型（TensorRT加速）

最新发布

09-06

通过滑窗法流程图可以很清晰理解其主要思路：首先对输入图像进行不同窗口大小的滑窗进行从左往右、从上到下的滑动。每次滑动时候对当前窗口执行分类器(分类器是事先训练好的)。如果当前窗口得到较高的分类概率，则...

yolov5各个版本 tensorrt cfg文件

02-16

yolov5各个版本 tensorrt cfg文件，下载地址： https://github.com/enazoe/yolo-tensorrt/blob/master/yolov5_tutorial.md 担心作者哪天不再共享，特地下载下来，分享给大家。

Yolov5的3种tensorRT加速方式及3090测评结果（C++版和Python torchtrt版）

藏晖的博客

10-08

2万+

本文中，我想测评下tensorRT，看看它在不同方式下的加速效果。用Tensorrt加速有两种思路，一种是构建C++版本的代码，生成engine，然后用C++的TensorRT加速。另一种是用Python版本的加速，Python加速有两种方式，网络上基本上所有的方法都是用了C++生成的engine做后端，只用C++来做前端，这里我提供了另外一个用torchtrt加速的版本。一、安装Tensorrt参考教程所有工程前最苦恼的问题，配置环境。。以下是我参考的连接。 1、安装可以通过tar或者deb安装 h

tensorRT推理yolov5.trt模型崩溃

cumtchw

10-21

1299

tensorRT推理yolov5.trt模型崩溃

YOLOV5加速之TensorRT Python版API构建模型

09-30

985

看到几篇文章转YOLOV5到TRT时基本都在用C++构建，实际上TRT也有Python版本的API，自己试着搞了下也能用效果一样，下面贴下代码： from collections import OrderedDict import tensorrt as trt import torch from numpy import ceil import numpy as np TRT_LOGGER = trt.Logger(trt.Logger.WARNING) INPUT_BLOB_NAME = "d

yolov5从V1.0到V6.2网络变化梳理

chy5764的博客

09-25

6122

yolov5从V1.0到V6.2网络变化梳理

2021.11.01 c++下 opencv部署yolov5-6.0版本 (四)

qq_34124780的博客

11-01

2万+

此篇文章针对yolov5的6.0版本，4.0和5.0版本请看前面三篇的修改。

tensorrt yolov5_trt.py 注释

Recursions的博客

02-16

1599

""" An example that uses TensorRT's Python api to make inferences. """ import ctypes import os import shutil import random import sys import threading import time import cv2 import numpy as np import pycuda.autoinit import pycuda.driver as cuda import ten.

下载yolov5需要的版本

雪剑封心

06-13

1万+

在github网站搜索yolov5 直达网址：https://github.com/ultralytics/yolov5点击图中：+ 7 releases 进行选择版本滚轮下面寻找自己需要的版本在对应版本下面选择自己需要的与训练权重文件选择预训练权重下载源码方式，可以在这里直接下载压缩文件。点击版本选择源码版本 git格式: git clone 地址例如：yolov5-6.0版本...

YOLOv8模型trt加速

07-25

YOLOv8是一种基于深度学习的目标检测模型，其设计旨在提高目标检测的速度和精度。而TRT（TensorRT）则是NVIDIA提供的一款高性能推理优化工具，用于加速深度学习模型的运行速度。 ### YOLOv8模型 YOLOv8模型是YOLO系列的最新版本，它采用了更先进的神经网络架构和技术，如Pyramid Attention Networks (PAN) 和 EfficientNet，以提升检测性能。相比之前的Yolo模型，YOLOv8通常能提供更快的检测速度和更高的准确度。 ### TRT加速原理 TensorRT通过对预先训练好的模型进行优化，可以显著加快模型在GPU上的推理速度。这个过程涉及静态图优化、内存优化以及算法优化等步骤： 1. **静态图优化**：TensorRT将模型转换成静态计算图，避免了动态执行过程中需要频繁查找操作和变量的问题，提高了执行效率。 2. **内存优化**：TensorRT对模型中的张量进行了布局优化，并利用共享内存和高速缓存减少内存访问时间。 3. **算法优化**：通过硬件特定的优化技术，比如利用GPU特有的并行处理能力，以及优化卷积和批标准化等常用运算的执行路径，进一步提升了模型的运行效率。 ### 将YOLOv8模型应用到TRT加速的流程 1. **模型训练与准备**：首先，你需要使用合适的训练数据集和配置文件来训练YOLOv8模型，生成权重文件。 2. **模型转换**：使用TensorFlow、PyTorch等框架提供的API，将训练好的模型导出，然后使用TensorRT的`convert_to_trt.py`脚本或者其他SDK函数将其转换为优化后的ONNX或TF Lite格式。 3. **创建引擎**：借助TensorRT SDK，通过指定模型输入和输出信息，以及所需的优化策略（如FP16混合精度），构建一个具体的TensorRT引擎。这一步骤会将模型结构和参数映射到特定硬件上，以便后续的快速推理。 4. **推理与部署**：最后，在实际应用中加载该引擎，将图像或其他输入数据传入模型进行推理，利用TRT的高效执行特性获得结果。 ### 相关问题: 1. TRT加速如何影响YOLOv8的实际应用性能？ 2. 使用TRT进行YOLOv8模型加速的步骤有哪些关键点需要注意？ 3. TRT是否支持所有类型的GPU？