【tensorrt】——torch.argmax转到tensorrt之后输出结果出现1.5e-44

最新推荐文章于 2024-09-07 14:56:11 发布

农夫山泉2号

最新推荐文章于 2024-09-07 14:56:11 发布

阅读量1.5k

点赞数

分类专栏：嵌入式AI 文章标签： argmax tensorrt torch

本文链接：https://blog.csdn.net/u011622208/article/details/111634807

版权

嵌入式AI 专栏收录该内容

159 篇文章 54 订阅

订阅专栏

描述
将 pytorch 的模型，模型的最后是 torch.argmax 操作。转换成onxx，再用 tensorrt 进行推理的时候，结果不对，出现了 1.5e-44 这样的数值。正确的应该都是整数才是。

软件

pytorch1.1.0
tensorrt5.1.5.0

解决方案
原因是 torch.argmax 返回的结果是 Long 型，而我在用 python tensorrt 进行推理的时候，申请内存的时候全按 float 类型处理了。如下：

h_input  = cuda.pagelocked_empty(trt.volume(engine.get_binding_shape(0)), dtype=trt.nptype( trt.float32 ))

我们也可以看一下，pytorch onnx 模型转换时的输出信息（argmax部分）：

%outputy : Long(1, 480, 640) = onnx::ArgMax[axis=1, keepdims=0](%636)

所以在这里应该用 trt.int32，最简单的方法就是用方法： engine.get_binding_dtype(0) ，自动可以获得输入输出的数据类型。

h_input  = cuda.pagelocked_empty(trt.volume(engine.get_binding_shape(0)), dtype=trt.nptype( engine.get_binding_dtype(0) ))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

农夫山泉2号

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PaddleSeg学习4——paddle模型使用TensorRT推理（c++）

WAF

01-12

935

类型，模型不含softmax和argmax处理，导致在项目应用过程中后处理耗时较高。在网络末端增加softmax和argmax算子，解决应用中的后处理耗时问题。由于是动态输入，因此指定了输入尺寸范围和最优尺寸。将导出的预测模型文件保存为。文件夹中的预测模型导出为ONNX格式模型。将导出的预测模型文件保存为。将导出的预测模型文件保存在。参数选项，可通过以下代码在模型末端增加。（1）安装Paddle2ONNX。中的语义分割模型输出为。

yolov8实战第三天——yolov8TensorRT部署（python推理）（保姆教学）

最新发布

浩瀚之水的专栏

09-07

557

在PyTorch中，, 和是三个非常不同但经常一起使用的函数，它们在处理张量（Tensor）时各有其特定的用途。下面将分别解释它们的使用方法及区别。

tensorRT推理

IT菜鸟

09-29

2860

一、参考资料第一步：ubuntu18.04装TensorRT8.0.0.3 + onnx1.8.0 + onnx_tensorrt 第二步：pytorch模型转onnx模型步骤和可能遇到的问题第三步：onnx模型导入tensorrt生成优化engine + 在GPU上推理 Additional TensorRT resources 深入理解 TensorRT (1) TensorRT Python API 详解二、重要说明对于每一个输入张量与输出张量，都需要分配两块资源，分别是主机内存（Host）

TensorRt（2）快速入门介绍

热爱生活，忠于自己

11-27

2140

TensorRt的安装，不同环境下的安装不做介绍，注意不同版本对系统和软件版本的要求。先介绍tensorrt的常规开发周期流程：这个部分不属于TensorRt的内容范畴。通常训练网络模型使用高性能的服务器，使用的框架常见的有Tensorflow、pytorch、caffe、mxnet等。之后被TendorRt加载或转成换能够加载的模型格式。加载第三方模型（目前仅支持onnx、caffe、uff）进行模型编译并从多个方面优化，生成序列化的engine模型，以plan形式保存。

Pytorch转onnx到tensorRT运行

weixin_42494287的博客

06-25

3865

目前pytorch1.1版本转onnx会存在bug，采用pytorch1.0.1版本的，torchvision版本为0.2.1,建议到conda中安装，使用pip方法安装torchvision一定要注意指定torchvision版本为0.2.1,可以选择离线安装，否则很容易安装成0.3版本的，就会带动torch版本升级成1.1。安装环境：Ananconda下创建pytorch虚拟环境，ubun...

TensorRT5介绍及Pytorch转TensorRT5代码示例

连正的博客

04-12

1万+

1 TensorRT简介 TensorRT的核心是一个c++库，它促进了对NVIDIA图形处理单元(gpu)的高性能计算。它与TensorFlow，Pytorch等框架相辅相成。他可以快速高效的运行一个已经训练好的神经网络，并生成结果。它包括用于从Caffe、ONNX或TensorFlow导入现有模型的解析器，以及用于以编程方式构建模型的c++和Python api。TensorRT在所有支持的平...

TensorRT优化原理和TensorRT Plguin总结

HanBlogs

10-24

1万+

文章目录1. TensorRT优化原理2. TensorRT开发基本流程3. TensorRT Network Definition API4. TensorRT Plugin4.1 实现plugin4.2 编译plugin.so动态库4.3 在TensorRT中加载plugin5. plugin实例 1. TensorRT优化原理 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接...

一个demo了解TensorRT的PTQ和QAT

qq_35435798的博客

08-17

TensorRT框架下的PTQ和QAT，一个demo了解TensorRT的PTQ和QAT

多模态大模型：技术原理与实战在LLM时代，对软件研发的更多思考————从软件 1.0 迈向软件 2.0 时代

AI天才研究院

06-29

970

软件1.0 vs 软件2.0 - **软件1.0**：传统的软件开发方法，通过人工编写明确的**程序逻辑和规则**来实现功能。 - **软件2.0**：利用AI和机器学习技术，通过**训练模型来"学习"如何执行任务，而不是显式编程**。在这种范式下，软件的行为更多地**由数据和学习算法决定，而不是固定的规则。**

PyTorch模型转ONNX后再转TensorRT遇到的几个报错

lavinia_chen007的博客

10-11

8576

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

深入理解 TensorRT (1) TensorRT Python API 详解

清欢

04-02

9797

文章目录0. 前言1. 基本概念1.1 Logger1.2 Builder1.3. Runtime1.4 ICudaEngine1.5 IExecutionContext2. 推理2.1 相关API详解2.2 实例3. ONNX 模型转换4. Dynamic Shape5. 插件 0. 前言之前浏览过Python API并输出了笔记，但在实际使用过程中，上次的笔记没有任何卵用…… 所以，本文根据 API 提供的几个功能，分别介绍相关API以及实例，希望下次用到TensorRT的时候，可以直接在这里

【CV学习笔记】tensorrt篇之cuda_python

Rex大居

05-30

2738

1、前言在使用tensorrt的时候，一般是使用cpp，对于cpp基础一般的同学不是很友好，尤其是在学习的过程中，而cpp主要是在部署的时候用到，最近了解到了Nvidia推出的cuda-python库，与之前的pycuda有类似的功能，但整体的编码风格与cpp类似，可以参考下文的代码，转成tensorrt之后，可以在python中先编写后处理的方式，有需要时再改写成cpp，也是一种不错的方式，但python版本的tensorrt相对于cpp来说仍然有不少的局限性。个人学习代码地址为: https://g

TensorRT推理手写数字分类（二）

qq_41596730的博客

02-08

595

TensorRT，onnx，onnxruntime

tensorrt 高级(1):完整的分类器实现

@bangbang的博客

09-15

1042

这里input_batch，input_channel，input_height，input_width可以从egine中获取，这里为了方便直接写死了。6）推理完后，将out_put_device数据拷贝到out_put_host中，并执行流同步，等待所有操作结束。有了onnx文件，就可以利用tensorrt进行分类模型的推理了，在推理前需要配置好。，就是需要的分类概率值,然后拿到label，以及对应的confidence。1 ) 分配存储输入图片的空间，包括device和host。

内置函数 Built-in Utilities

Loong Cheng的博客

03-27

1461

自动初始化 Automatic Initialization¶ 这个 pycuda.autoinit被引入的时候, 将会制动初始化，以便pug内核的计算。他用 pycuda.tools.make_default_context() 创建上下文. pycuda.autoinit.device 用于自动初始化的pycuda.driver.device的实例。 pycuda.autoinit...

TensorRT入门

weixin_42934657的博客

12-26

781

在训练了神经网络之后，TensorRT可以对网络进行压缩、优化以及运行时部署，并且没有框架的开销。TensorRT通过combines layers，kernel优化选择，以及根据指定的精度执行归一化和转换成最优的matrix math方法，改善网络的延迟、吞吐量以及效率。h_output就是模型输出的结果，后面再对这个输出结果做处理。加载engine模型并打印相关信息。

torch.argmax.

05-30

torch.argmax函数是一个PyTorch库中的函数，用于在指定维度上返回张量中最大值的索引。可以用它来实现分类任务中的预测值计算，以及模型评估中的准确率计算等等。其函数定义如下： ``` torch.argmax(input, dim=None...