win10下yolox tensorrt模型部署

黄家驹beyond

已于 2023-11-02 21:53:30 修改

阅读量241

点赞数 5

分类专栏： TensorRT-Alpha YOLO高级篇文章标签： YOLO pytorch python c++ 深度学习人工智能图像处理

于 2023-10-21 11:16:43 首次发布

本文链接：https://blog.csdn.net/m0_72734364/article/details/133957813

版权

TensorRT-Alpha 同时被 2 个专栏收录

21 篇文章 32 订阅

订阅专栏

YOLO高级篇

14 篇文章 5 订阅

订阅专栏

yolox tensorrt 部署效果

一、YOLOX简介

YOLOX是一种基于深度学习的目标检测算法，它的主要优点是速度快、精度高。相比其他目标检测算法，YOLOX在保持高精度的同时，能够实现更快的检测速度，这使得它在实际应用中具有很大的优势。
YOLOX的创新点主要体现在两个方面：SimOTA和PANet。SimOTA是一种基于Transformer的目标检测算法，它通过引入自注意力机制来提高模型的表达能力，从而提高了检测精度。PANet是一种金字塔注意力网络，它能够在不同的尺度上对目标进行检测，从而提高了模型的鲁棒性。
在业内，YOLOX已经得到了广泛的认可和应用。例如，在Kaggle的车辆检测挑战赛中，YOLOX获得了第一名的好成绩。此外，YOLOX还在COCO数据集上取得了很好的性能表现。这些成果表明，YOLOX是一种非常优秀的目标检测算法，具有很高的实用价值和广泛的应用前景。
从性能方面来看，YOLOX在速度和精度上都表现出色。在速度方面，YOLOX比其他一些主流的目标检测算法要快很多，这使得它在实时场景下的应用具有很大的优势。在精度方面，YOLOX与其他一些高精度的目标检测算法相当甚至更好。这些优点使得YOLOX成为了一种非常受欢迎的目标检测算法。
总之，YOLOX是一种非常优秀的目标检测算法，它具有速度快、精度高、创新性强等优点。在业内已经得到了广泛的认可和应用，并且在性能方面表现出色。未来，随着深度学习技术的不断发展和完善，相信YOLOX将会在更多的领域发挥出更大的作用。

本文提供深度学习CV领域模型加速部署案例，仓库实现的cuda c支持多batch图像预处理、推理、decode、NMS。大部分模型转换流程为：torch->onnx->tensorrt。

有源码！有源码！有源码！ 不要慌，哈哈哈。

在这里插入图片描述

二、Win10 TensorRT环境配置

三步解决win环境配置：

1、安装vs2019、Nvidia驱动、cuda，cudnn、opencv、tensorrt；
2、创建属性表；
3、工程设置，运行；
注：一定是先安装vs2019，再安装cuda，顺序不能颠倒，因为cuda会自动给vs2019安装插件。
问题：windows环境下，为什么使用vs2019属性表，而不用cmake？
回答：因为属性表可以做到：一次创建，到处使用。

2.1 安装VS2019

需要Microsoft账号，如果您有别的途径下载安装也可以。

进入：https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/
选择：[2019] -> [下载]
在新页面选择： Visual Studio Community 2019 (version 16.11)
下载完成之后安装过程选择如下图：
重启系统

2.2 安装库

注：Nvidia相关网站需要注册账号。

2.2.1 安装Nvidia显卡驱动

进入： https://www.nvidia.cn/Download/index.aspx?lang=cn#
依据实际情况选择，如下图是我的选择(for RTX3070)：
选择：[搜索]->[下载] ->[双击默认安装] -> [重启系统] -> [进入cmd]，输入如下指令：

nvidia-smi

看到如下信息表明驱动正常：
请添加图片描述

2.2.2 安装 cuda11.2

进入: https://developer.nvidia.com/cuda-toolkit-archive
选择：CUDA Toolkit 11.2.0 (December 2020)
选择：[Windows] -> [x86_64] -> [10] -> [exe(local)] -> [Download(2.9GB)]
双击安装，重启在cmd窗口输入如下指令：

nvcc -V

CMD窗口打印如下信息表示cuda11.2安装正常

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Nov_30_19:15:10_Pacific_Standard_Time_2020
Cuda compilation tools, release 11.2, V11.2.67
Build cuda_11.2.r11.2/compiler.29373293_0

note:cuda11.2 不需要手动设置环境变量，如下图，环境变量都是自动设置的。
请添加图片描述

2.2.3 安装 cudnn8.2.1

进入网站：https://developer.nvidia.com/rdp/cudnn-archive
选择： Download cuDNN v8.2.1 (June 7th, 2021), for CUDA 11.x
选择： cuDNN Library for Windows (x86)
你将会下载这个压缩包: “cudnn-11.3-windows-x64-v8.2.1.32_2.zip”
解压之后，cudnn的头文件、库文件都要拷贝到cuda安装目录。
如下图，进入cudnn解压所在文件夹中include，拷贝所有头文件，粘贴到CUDA/v11.2/include中
lib、bin中的文件也拷贝到对应cuda目录中
重启系统

2.2.4 下载 tensorrt8.4.2.4

进入网站： https://developer.nvidia.com/nvidia-tensorrt-8x-download
把这个打勾： I Agree To the Terms of the NVIDIA TensorRT License Agreement
选择: TensorRT 8.4 GA Update 1
选择: TensorRT 8.4 GA Update 1 for Windows 10 and CUDA 11.0, 11.1, 11.2, 11.3, 11.4, 11.5, 11.6 and 11.7 ZIP Package
你将会下载这个压缩包: “TensorRT-8.4.2.4.Windows10.x86_64.cuda-11.6.cudnn8.4.zip”
解压到F:\ThirdParty，并重命名为：TensorRT-8.4.2.4
并将路径"F:\ThirdParty\TensorRT-8.4.2.4\lib"添加到环境变量，如下图：
重启系统

2.2.5 OpenCV4.5.5安装

进入：https://opencv.org/releases/
选择：[OpenCV – 4.5.5] -> [Windows]
下载完成之后，是一个exe的自解压格式，解压到：D:\ThirdParty
并将路径：“D:\ThirdParty\opencv4.5.5\build\bin” 和 "D:\ThirdParty\opencv4.5.5\build\x64\vc15\bin"添加到环境变量，如下图：
重启系统
note：我的opencv在D盘，tensorrt在E盘，根据实际情况修改就行了。

2.3 创建属性表

一般地，Visual Studio 2019，一个库对应两个属性表文件，分别对应：vs2019的debug模式和release模式，例如：本文中OpenCV创建了这两种。而TensorRT和CUDA只需要创建一种属性表(适用以上两种模式)。

2.3.1 创建OpenCV属性表

创建opencv库debug属性表：

step1：基于VS2019随便新建一个C++项目，如下图，项目设置为Debug、X64模式
step2：如下图，选择：[属性窗口] -> [右击Debug|x64] -> [添加新项目属性表]
step3：文件命名为：OpenCV4.5.5_DebugX64.props -> [添加]
编辑属性表：[如下图：双击属性表]
step4：如下图，选择：[通用属性] -> [VC++目录] -> [包含目录] -> [编辑]
step5：如下图，将两个OpenCV两个头文件目录拷贝进去 -> [确认]
step6：选择：[通用属性] -> [VC++目录] -> [库目录] -> [编辑] -> 将路径："D:\ThirdParty\opencv4.5.5\build\x64\vc15\lib"拷贝进去 -> [确认]
step7：选择：[通用属性] -> [链接器] -> [输入] -> [附加依赖项] -> 将文件名"opencv_world455d.lib"拷贝进去->[确认]
小结：

到这里，opencv库debug属性表制作完成，release属性表和上述流程一样，唯一区别在于，如下图，项目切换到Release x64模式，新建OpenCV4.5.5_ReleaseX64属性表，然后在step7中，将文件名修改为：“opencv_world455.lib”

请记住，制作属性表就3个步骤：
拷贝include路径
拷贝lib路径，外加设置dll到系统环境变量
拷贝lib文件名称

2.3.2 创建TensorRT属性表

右击Debug|x64 or 右击Release|x64新建属性表，重命名为：TensorRT8.4.2.4_X64，

# include路径
F:\ThirdParty\TensorRT-8.4.2.4\include
F:\ThirdParty\TensorRT-8.4.2.4\samples\common
# F:\ThirdParty\TensorRT-8.4.2.4\samples\common\windows # 这个路径文件不需要包含
# lib路径
F:\ThirdParty\TensorRT-8.4.2.4\lib
# lib文件名称（for release& debug）
nvinfer.lib
nvinfer_plugin.lib
nvonnxparser.lib
nvparsers.lib

依照上一节3个步骤：

step1：选择：[通用属性] -> [VC++目录] -> [包含目录] -> [编辑] -> 把上述3个include路径拷贝进去
step2：选择：[通用属性] -> [VC++目录] -> [库目录] -> [编辑] -> 把上述lib路径拷贝进去
step3：选择：[通用属性] -> [链接器] -> [输入] -> [附加依赖项] -> [编辑] -> 将上述lib文件名称拷贝进去->[确认]
最后，修改tensorrt属性表：[通用属性] -> [C/C++] -> [预处理器] -> [预处理器定义] -> 添加指令：_CRT_SECURE_NO_WARNINGS -> [确认]

2.3.3 创建CUDA属性表

CUDA属性表直接白嫖官方，在路径：C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\visual_studio_integration\MSBuildExtensions\CUDA 11.2.props

最后，我们应该有了如下属性表文件：
请添加图片描述
其中，cuda 和tensorrt的属性表同时兼容release x64 和debug x64，你再新建TensorRT-Alpha中yolov8 yolov7 yolov6 等项目后，只需要把上述提前做好的属性表引入到工程就行了，当然项目还需要进行简单设置(设置NVCC，避免tensorrt的坑)，在后文提到。属性表做到了一次新建，到处使用。

2.3.4 新建工程与设置

这一节演示如何新建vs工程，如何设置工程，是通用方法。适用于仓库所有模型源码。

2.3.4.1 新建vs工程

如下图，打开vs2019，点击：文件 -> 新建-> 项目。
请添加图片描述
选择：空项目 -> 下一步。
在这里插入图片描述
选择创建。

如下图，现在将工程设置为：Release X64。

2.3.4.2 vs2019工程设置

如下图，选择：属性管理器 -> Release | x64 -> 添加现有属性表，把上一节生成的三个RleaseX64属性表添加进来。
在这里插入图片描述
添加进来后样子如下图：

TensorRT项目包含c++和cuda c代码，通俗讲，c++代码文件格式为：

.h头文件
.cpp文件
由c++编译器编译
而cuda代码头文件格式为：
.h头文件
.cu文件
由NVCC编译器编译
例如：我们添加如下图5个文件，在工程中。

添加CUDA依赖：右击项目 -> 生成依赖项 -> 生成自定义

将如下图CUDA11.2打钩 -> 确认

右击项目 -> 属性，将会打开如下界面，将字符集设置为未设置，点击确认。

最后，在项目中，同时选中所有.cu文件和对应的.h文件，注意是所有。我这里就是a.h 和 a.cu文件了。然后右击 -> 点属性。
【注】：在tensorrt-alpha开源项目中，例如yolov8，会添加多个.cu .cpp .h格式文件，其中.cu和对应的.h文件都是这样设置，目的就是让NVCC编译器来编译cuda代码。

得到如下界面，我们把项类型设置为CUDA C/C++，点击确认。

然后编译一下：

编译成功如下图：

三、从yolox源码中导出onnx文件

可以直接从网盘下载onnx文件[weiyun]:weiyun or google driver ，你也可以自己下载仓库，然后按照下面指令手动导出onnx文件，下载yolox源码：

# 下载yolox源码
git clone https://github.com/Megvii-BaseDetection/YOLOX
git checkout  0.3.0

安装 yolox环境

pip install -r requirements.txt

命令行进入yolox源码根目录，用以下指令导出onnx模型文件，以下是batch_size=1的方式，多batch模型导出，可以去看仓库。

## batch_size=1
# 640 for image
python tools/export_onnx.py --output-name=yolox_s.onnx  --exp_file=exps/default/yolox_s.py --ckpt=yolox_s.pth --decode_in_inference --batch-size=1
python tools/export_onnx.py --output-name=yolox_m.onnx  --exp_file=exps/default/yolox_m.py --ckpt=yolox_m.pth --decode_in_inference --batch-size=1
python tools/export_onnx.py --output-name=yolox_x.onnx  --exp_file=exps/default/yolox_x.py --ckpt=yolox_x.pth --decode_in_inference --batch-size=1
python tools/export_onnx.py --output-name=yolox_s.onnx  --exp_file=exps/default/yolox_s.py --ckpt=yolox_s.pth --decode_in_inference --batch-size=1
# 416 for image
python tools/export_onnx.py --output-name=yolox_nano.onnx --exp_file=exps/default/yolox_nano.py --ckpt=yolox_nano.pth --decode_in_inference --batch-size=1
python tools/export_onnx.py --output-name=yolox_tiny.onnx --exp_file=exps/default/yolox_tiny.py --ckpt=yolox_tiny.pth --decode_in_inference --batch-size=1

四、利用tensorrt编译onnx模型

将上一个章节中导出onnx模型放到任意路径。进入到tensorrt根目录下bin文件里，里面有个tensorrt官方提供的模型编译工具，即：trtexec.exe 如下图：
在这里插入图片描述
然后使用，以下指令编译onnx模型，需要注意：参数 --onnx 和 --saveEngine 可以设置为自定义路径，例如：

 --onnx=d:/Data/xxx.onnx  --saveEngine=d:/Data/xxx.trt

# 640
./trtexec.exe   --onnx=yolox_s.onnx   --saveEngine=yolox_s.trt  --buildOnly
./trtexec.exe   --onnx=yolox_m.onnx   --saveEngine=yolox_m.trt  --buildOnly
./trtexec.exe   --onnx=yolox_x.onnx   --saveEngine=yolox_x.trt  --buildOnly
# 416
./trtexec.exe   --onnx=yolox_nano.onnx   --saveEngine=yolox_nano.trt  --buildOnly
./trtexec.exe   --onnx=yolox_tiny.onnx   --saveEngine=yolox_tiny.trt  --buildOnly

五、编译执行yolox-tensorrt工程

下载源码并编译

git clone https://github.com/FeiYull/tensorrt-alpha

仿造 2.3.4 新建工程与设置 中新建、设置vs2019工程；其中，yolox需要将如下图多个文件添加到工程中：

红色框内文件来自TensorRT-Alpha/utils/
蓝色框内文件来自TensorRT-Alpha/yolox/
绿色框内文件来自TensorrRT安装路径下：TensorRT-8.4.2.4.Windows10.x86_64.cuda-11.6.cudnn8.4\TensorRT-8.4.2.4\samples\common\logger.cpp

在这里插入图片描述
如下图，yolox项目编译成功，从下面编译信息可以看到，exe文件所在路径为：

D:\VS2019_Project\TensorRT-Alpha\x64\Release\yolox.exe

1>------ 已启动生成: 项目: yolox, 配置: Release x64 ------
1>app_yolox.cpp
1>D:\ThirdParty\TensorRT-8.4.2.4\include\NvInfer.h(5349,1): warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失
1>D:\ThirdParty\opencv\build\include\opencv2\objdetect\aruco_board.hpp(1,1): warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失
1>D:\TensorRT-Alpha\yolox\app_yolox.cpp(43,106): warning C4267: “参数”: 从“size_t”转换到“const int”，可能丢失数据
1>正在生成代码
1>1 of 1021 functions (<0.1%) were compiled, the rest were copied from previous compilation.
1>  0 functions were new in current compilation
1>  1 functions had inline decision re-evaluated but remain unchanged
1>已完成代码的生成
1>yolox.vcxproj -> D:\VS2019_Project\TensorRT-Alpha\x64\Release\yolox.exe
1>已完成生成项目“yolox.vcxproj”的操作。
========== 生成: 成功 1 个，失败 0 个，最新 0 个，跳过 0 个 ==========

以下是命令行执行指令，需要说明的是执行推理任务，支持图片、视频、摄像头

# infer image
./app_yolox.exe  --model=../../data/yolox/yolox_s.trt     --size=640 --batch_size=1  --img=../../data/6406401.jpg  --show --savePath=../
# infer video
./app_yolox.exe  --model=../../data/yolox/yolox_s.trt     --size=640 --batch_size=8  --video=../../data/people.mp4  --show 
# infer camera
./app_yolox.exe  --model=../../data/yolox/yolox_s.trt     --size=640 --batch_size=8  --cam_id=0  --show
# 416
./app_yolox.exe  --model=../../data/yolox/yolox_nano.trt  --size=416 --batch_size=1  --img=../../data/6406401.jpg  --show --savePath

这里给个示范，例如我要在命令行使用yolox推理一张图：

.\yolox.exe --model=D:\ThirdParty\TensorRT-8.4.2.4\bin\yolox_s.trt     --size=640 --batch_size=1  --img=d:/Data/1.jpg  --show --savePath=../

效果如下图：
在这里插入图片描述
下面是yolox推理视频效果，可以自己玩一玩：

.\yolox.exe --model=D:\ThirdParty\TensorRT-8.4.2.4\bin\yolox_s.trt     --size=640 --batch_size=1  --video=E:\VideoAlpha\source_video\football.mp4  --show  --savePath=D:\Data\save\