tensorrt和onnxruntime-gpu同时调用gpu时tensorrt推理出现错乱解决方式

Deeping_Labels

已于 2023-03-03 10:56:54 修改

阅读量889

点赞数

文章标签： python 深度学习 Powered by 金山文档

于 2023-03-02 17:54:26 首次发布

本文链接：https://blog.csdn.net/weixin_55783281/article/details/129305875

版权

问题：当我在同一个进程同时调用tensorrt和onnxruntime-gpu时出现了tensorrt推理结果全为0的情况

解决方式：

将onnxruntime-gpu放到cpu上，但是cpu的推理速度明显会不如gpu

如果在python中请一定先加载tensorrt模型，最后再加载onnx模型，比如在demo中import时，先调用tensorrt推理，最后再调用onnxruntime-gpu，但是只能保证第一次调用输出正确。

如果有多张显卡，可以将onnxruntime-gpu放到另一张卡上。

device_name = 'cuda:0'

if device_name == 'cpu':
    providers = ['CPUExecutionProvider']
elif device_name == 'cuda:0':
    providers = ['CUDAExecutionProvider', 'CPUExecutionProvider']
else:
    providers = ['CPUExecutionProvider']

character = " &#(),+-./0123456789:<ABCDEFGHIJKLMNOPQRSTUVWXYZabceghilmnoprstuvy?"

# ort_session = onnxruntime.InferenceSession("./detect/detect_1.onnx", providers=providers)
ort_session = onnxruntime.InferenceSession("identify/model.onnx", providers=providers)

d.因为是同进程同流导致的数据问题，所以可以在流输入时更换掉onnxruntime-gpu的输入流，是需要放在调用函数。

import pycuda.driver as cuda
import pycuda.autoinit

new_stream = cuda.Stream()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Deeping_Labels

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorrt和onnxruntime-gpu同时调用gpu时tensorrt推理出现错乱解决方式

tensorrt和onnxruntime-gpu同进程冲突
复制链接

扫一扫

pip install onnxruntime-gpu 的版本兼容问题

huzhifei的专栏

08-09

5618

Win10 下Pytorch1.9.0+cu102 安装 onnxruntime-gpu 后运行到onnx模型加载推理后一直提示加载库错误 [E:onnxruntime:Default, provider_bridge_ort.cc:952 onnxruntime::ProviderLibrary::Get] Failed to load library, error code: 126 查看onnxruntime-gpu的版本是1.8.1，经过分析这类错误大多和版本相关。 pip insta...

onnxruntime推理时切换CPU/GPU以及修改onnx输入输出为动态

CaiDou的博客

09-02

9109

onnx模型作为中间模型，相较于pytorch直接推理，是有加速度效果的，且推理代码简单，不需要load各种网络。最近某些项目因为显存不够，onnxruntime推理时切换CPU/GPU，实现某些模型在CPU上推理，某些在GPU上推理。查了一些别人的文章发现很多人都说onnxruntime推理没法像pytorch那样指定GPU,CPU,只能卸载一个GPU用CPU，卸载CPU用GPU。个人感觉不应该是这样的，点进去源码一看，明明有配置CPU,GPU的参数，而且很简单。

参与评论您还未登录，请先登录后发表或查看评论

深度学习模型部署——基于Onnx Runtime的深度学习模型CPU与GPU部署（C++实现）

u013250861的博客

05-29

843

许多机器学习和深度学习模型都是在基于 Python 的框架中开发和训练的，例如 PyTorch 和 TensorFlow 等。但是，当需要将这些训练好模型部署到生产环境中时，通常会希望将模型集成到生产流程中，而这些流程大多是用 C++ 编写的，因为 C++ 可以提供更快的实时性能。目前有许多工具和框架可以帮助我们将预训练模型部署到 C++ 应用程序中。

ONNX模型推理使用多核CPU加速推理

weixin_43999691的博客

05-17

5905

对于嵌入式设备，将模型转成onnx后，可以方便的将pytorch或者tensorflow的模型在嵌入式设备上运行，但是onnx模型默认只调用一个CPU核心去做推理，所以有些嵌入式设备有多核的CPU，推理推理可以适当的加速。

onnx runtime文档学习4-Execution Providers (EP)架构

青椒的学习笔记

03-12

750

本教程第一篇：介绍ONNX Runtime(ORT)的基本概念。本教程第二篇：是一个快速指南，包括安装ONNX Runtime；安装ONNX进行模型输出；Pytorch, TensorFlow和SciKit的快速开始例子本教程第三篇：CUDA Execution Provider本教程第四篇：上一篇介绍CUDA EP，本教程介绍EP的相关概念，包括相关的架构。通过上面的介绍，可以得知模型可以运行在多个设备上，因此下一个教程，我们介绍加速pytorch代码相关的内容。

onnxruntime安装了GPU版本，但是还是使用cpu的可能原因

york1996的博客

06-30

2574

pytorch等可以用cuda来运行。确保指定cuda来运行。 ort_session=ort.InferenceSession(onnx_path,providers=[" CUDAExecutionProvider "]) # CUDAExecutionProvider CPUExecutionProvider 可能原因是没有安装cudnn，可以用conda install cudnn试试。gpu版本比cpu版本还是要快四五倍的。...

深度学习-Python调用ONNX模型

captain

09-20

7547

例如，如果您的模型期望的输入形状是(batch_size, 10)，您可以将示例代码中的input_size变量设置为10。在您给出的代码中，您正在尝试将一个形状为(batch_size, 784)的输入张量提供给模型，但是模型期望输入张量的形状为(batch_size, 10)。因此，ONNX是一种强大的深度学习模型转换和部署工具，可以大大加速深度学习模型的开发和部署过程。导出模型：在训练好深度学习模型后，通过ONNX的支持的框架，比如PyTorch、TensorFlow等将模型导出为ONNX格式。

onnxruntime-win-x64-gpu-1.16.2.zip

11-17

总之，"onnxruntime-win-x64-gpu-1.16.2.zip"是一个强大的工具，用于在Windows x64平台上利用GPU加速ONNX模型的推理。通过理解ONNX Runtime的工作原理和特性，开发者可以有效地利用此库构建高性能的应用程序。

onnxruntime-win-x64-gpu-1.14.0

06-09

标题中的“onnxruntime-win-x64-gpu-1.14.0”指的是ONNX Runtime的Windows 64位GPU版本，版本号为1.14.0。ONNX Runtime是一个高性能的推理引擎，主要用于运行经过训练的机器学习模型，它支持多种框架如TensorFlow、...

onnxruntime-linux-x64-gpu-1.16.2.tgz

11-17

此“onnxruntime-linux-x64-gpu-1.16.2.tgz”压缩包包含了针对Linux平台上x64架构的ONNX Runtime库，特别是针对GPU加速的版本。这个库不仅包括了必要的动态链接库（.so文件），还提供了头文件（.h文件）以便开发者在...

onnxruntime-win-x64-gpu-1.18.0.zip

热门推荐

juluwangriyue的博客

01-09

1万+

ValueError: This ORT build has ['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider'] enabled. Since ORT 1.9, you are required to explicitly set the providers parameter when instantiating InferenceSession. For example, onnxruntime.I

ComfyUI使用reactor换脸ValueError: This ORT build has [‘TensorrtExecutionProvider‘, ‘CUDAExecutionProvide

满目星辰

12-27

3440

安装完成之后，用conda list 或者pip list或者直接进入环境的\Lib\site-packages文件夹中查看。下面的1.16.3版本应该是之前装的cpu版本没有卸载导致的残留信息，直接删除就好了。于是上网收集各种信息，最后终于确定了，就是onnxruntime版本的问题。果然，我的onnxruntime_gpu版本是1.15.0的。于是我先卸载，然后直接装上，再看看能不能跑通。好了，今天的内容就到这里，如果遇到其他。果然，已经安装完成。

rembg报错onnxruntime_providers_tensorrt.dll

weixin_45615730的博客

03-16

1939

相当于不用gpu了，就用cpu。其实如果用rembg抠图的话，cpu和gpu速度差不多，没什么影响。卸载onnxruntime-gpu。卸载onnxruntime。重装onnxruntime。

使用onnxruntime-gpu 模型推理

liguiyuan的博客

08-09

1万+

更新onnxruntime版本，使用onnxruntime-gpu版本来推理

onnxruntime-gpu安装

09-21

要安装onnxruntime-gpu，您可以按照以下步骤进行操作： 1. 首先，确保您的计算机上已经安装了适当的GPU驱动程序，并且您的GPU支持CUDA。 2. 确保您的系统中已经安装了CUDA Toolkit。您可以从NVIDIA官方网站下载并安装适用于您的操作系统和GPU型号的CUDA Toolkit。 3. 在安装CUDA Toolkit之后，您需要安装cuDNN库。cuDNN是一个针对深度神经网络的加速库。您可以从NVIDIA开发者网站下载适用于您的CUDA版本的cuDNN，并按照说明进行安装。 4. 确保您的Python环境已经安装和配置正确。您可以使用pip命令来安装所需的Python包。 5. 最后，您可以使用pip命令来安装onnxruntime-gpu： ``` pip install onnxruntime-gpu ``` 这样就完成了onnxruntime-gpu的安装。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交