编译带 tensorrt 的 onnxruntime

最新推荐文章于 2025-03-11 10:31:34 发布

wujpbb7

最新推荐文章于 2025-03-11 10:31:34 发布

阅读量3.4k

点赞数 2

分类专栏：模式识别文章标签： onnxruntime tensorrt

本文链接：https://blog.csdn.net/blueblood7/article/details/116158790

版权

在一个干净的docker环境（ubuntu16.04）中编译带 tensorrt 的 onnxruntime：

过程：

# 先 build 出 wheel
root@4ab06d738053:/tools/onnxruntime# ./build.sh \
	--parallel 8 \
	--use_cuda \
	--cuda_version=11.1 \
	--cuda_home=/usr/local/cuda \
	--cudnn_home=/usr/local/cuda \
	--use_tensorrt --tensorrt_home=/usr/local/lib/python3.8/dist-packages/tensorrt \
	--build_shared_lib --enable_pybind \
	--build_wheel --update --build \
	--config Release

# 安装 wheel
root@4ab06d738053:/tools/onnxruntime# pip install build/Linux/Release/dist/onnxruntime_gpu_tensorrt-1.7.0-cp38-cp38-linux_x86_64.whl

# 查看结果，如果 import onnxruntime 有错误，要卸载 onnxruntime-gpu
root@4ab06d738053:/tools/onnxruntime# pip list | grep onnxruntime
onnxruntime-gpu          1.7.0
onnxruntime-gpu-tensorrt 1.7.0

出现的问题：

1、缺少 git 。

root@a42b2c92c7f3:/# git clone --recursive https://g

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wujpbb7

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Onnxruntime之tensorrt加速

如果想成为中心，那么就到中心去吧。

09-14

8057

引擎将在第一次构建时被缓存，因此下次创建新的推理会话时，引擎可以直接从缓存中加载。ORT_TENSORRT_INT8_USE_NATIVE_CALIBRATION_TABLE：选择在 INT8 模式下用于非 QDQ 模型的校准表。ORT_TENSORRT_CACHE_PATH：如果 ORT_TENSORRT_ENGINE_CACHE_ENABLE 为 1，则指定 TensorRT 引擎和配置文件的路径，如果 ORT_TENSORRT_INT8_ENABLE 为 1，则指定 INT8 校准表文件的路径。

ONNXRuntime、TensorRT扫盲

weixin_43870390的博客

02-20

1796

ONNXRuntime TensorRT

1 条评论您还未登录，请先登录后发表或查看评论

6.7.tensorRT高级(1)-使用onnxruntime进行onnx模型推理过程

周同学的博客

08-06

2512

6.7.tensorRT高级(1)-使用onnxruntime进行onnx模型推理过程

ONNX Runtime（onnxruntime 库）：Microsoft 开发的高性能推理引擎

彬彬侠的博客

03-11

1511

ONNX Runtime 是 Microsoft 开发的高性能推理引擎，用于运行 ONNX（Open Neural Network Exchange）格式的深度学习模型。它的主要目标是加速模型推理，并支持跨平台部署，使深度学习模型可以在 CPU、GPU、TPU、FPGA 和边缘设备上高效运行。通过 pip install onnxruntime 安装。适用于深度学习模型的优化和加速，尤其是跨框架部署和推理任务。可与 PyTorch、TensorFlow 结合，通过 ONNX 转换提高推理速度并优化

基于onnxruntime的C++版本TensorRt源码编译

三横先生的博客

07-20

1999

基于onnxruntime-tensorrt版本的编译提示：基于onnxruntime的tensorrt源码编译, C++版本

将训练好的模型应用——onnxruntime、TensorRT安装

SunPengMSE的博客

05-24

1778

本文可作为的后续。

onnxruntime-win-x64-gpu-1.18.0.zip

06-10

这个“onnxruntime-win-x64-gpu-1.18.0.zip”压缩包包含了针对Windows 64位平台的GPU优化版ONNX Runtime库，版本为1.18.0。它特别设计用来利用GPU的并行计算能力加速深度学习模型的推理过程。首先，让我们详细了解...

树莓派安装yolov5-lite所需的onnxruntime安装包，方便

04-09

6. **集成yolov5-lite**：将编译好的onnxruntime与yolov5-lite整合。将模型转换为ONNX格式，然后使用onnxruntime加载并执行模型。这一步通常涉及到模型的优化和调整，以适应树莓派的硬件资源。在树莓派上安装和...

onnxruntime-linux-x64-gpu-1.16.2.tgz

11-17

此“onnxruntime-linux-x64-gpu-1.16.2.tgz”压缩包包含了针对Linux平台上x64架构的ONNX Runtime库，特别是针对GPU加速的版本。这个库不仅包括了必要的动态链接库（.so文件），还提供了头文件（.h文件）以便开发者在...

Jetson Nano专用TensorRT8.2.3+ONNX Runtime GPU预编译包：JetPack4.6/YOLOv8/v11环境一键部署工具包

最新发布

03-20

（1）提供tensorrt-8.2.3.0-cp38-none-linux_aarch64.whl和onnxruntime_gpu-1.16.0-cp38-cp38-linux_aarch64.whl，严格匹配JetPack4.6（CUDA10.2+Python3.8）环境，规避手动编译耗时与依赖冲突问题‌。（2）支持...

onnxruntime c++ 推理示例（tensorRT/cuda provider)

wohenibdxt的博客

06-15

6828

onnxruntime-gpu：在 nvidia gpu 上跑onnx模型获得与tensorRT相媲美的推理速度

onnxruntime和tensorrt多batch推理

taifyang的博客

12-10

2826

【代码】onnxruntime和tensorrt多batch推理。

【YOLOv5】手把手教你使用LabVIEW ONNX Runtime部署 TensorRT加速，实现YOLOv5实时物体识别（含源码）

virobotics的博客

06-06

7924

使用LabVIEW开放神经网络交互工具包实现TensorRT加速YOLOv5

C++下将onnx模型转化为TensorRT模型（动态输入输出）

Justin_JGT的博客

04-19

1460

C++下做onnx模型像tensorRT模型转化的代码，其中输入输出为动态。

onxxruntime使用cuda以及tensorrt进行加速

zk_ken的博客

01-05

1171

1、版本匹配版本需要匹配，不然运行会报错。

5.1.tensorRT基础(2)-正确导出onnx的介绍，使得onnx问题尽量少

周同学的博客

07-23

1021

5.1.tensorRT基础(2)-正确导出onnx的介绍，使得onnx问题尽量少

将模型从 PyTorch 导出到 ONNX 并使用 ONNX Runtime 运行

yanglamei1962的博客

08-08

240

在本教程中，我们描述了如何将 PyTorch 中定义的模型转换为 ONNX 格式，然后在 ONNX Runtime 中运行它。ONNX Runtime 是针对 ONNX 模型的以性能为中心的引擎，可在多个平台和硬件(Windows，Linux 和 Mac 以及 CPU 和 GPU 上）高效地进行推理。如所述，事实证明，ONNX Runtime 可大大提高多个模型的性能。对于本教程，您将需要安装和。您可以使用获得 ONNX 和 ONNX Runtime 的二进制版本。

torch转onnx模型加速，onnx模型推理直接达到tensorRT速度，省去onnx转tensorRT的流程

unique_zhao的博客

12-20

854

torch转onnx直接实现tensorRT的速度

TensorRT推理——（二）转换成TensorRT模型、部署python版

weixin_39263657的博客

05-15

2860

使用TensorRT推理肯定是在英伟达GPU环境上进行推理的。

onnxruntime tensorrt

07-14

C知道: Onnxruntime和TensorRT是机器学习推理引擎，用于优化和加速深度学习模型的推理过程。它们都支持ONNX（开放式神经网络交换格式）模型，并提供了高度优化的推理性能。 Onnxruntime是一个跨平台的推理引擎，由微软开发。它提供了对多种硬件设备和操作系统的支持，包括CPU、GPU和专用加速器。Onnxruntime通过动态图执行和优化编译技术，实现了高性能的深度学习推理。 TensorRT是由NVIDIA开发的高性能推理引擎，专门用于在NVIDIA GPU上加速深度学习推理。TensorRT使用了一系列优化技术，包括网络剪枝、量化、层融合和张量内存管理等，以提供最佳的推理性能和低延迟。在使用ONNX模型进行推理时，可以选择使用Onnxruntime或TensorRT。Onnxruntime具有更广泛的硬件和操作系统支持，而TensorRT则专注于在NVIDIA GPU上提供最佳性能。选择哪个取决于你的需求和硬件环境。