【TensorRT】官方文档onnx序列化教程与推理教程

VIP文章澄鑫

已于 2024-04-03 15:12:51 修改

阅读量550

点赞数 7

分类专栏：推理平台|TensorRT 开发语言|C++ 文章标签： c++ CUDA

于 2024-01-28 22:47:17 首次发布

本文链接：https://blog.csdn.net/ycx_ccc/article/details/135901356

版权

😁😁官方文档onnx序列化教程与推理教程

一、构建TensorRT序列化模型
二、搭建阶段（三步走）
三、反序列化模型
- 动态维度输入的情况下
四、执行推理
五、补充说明（基于tensorRT-8.6.1）
- 5.1 🤨🤨在context中设置输入张量和输出张量
- 5.2 🤪🤪通用的设置输入张量与输出张量的方法

一、构建TensorRT序列化模型

本博客主要说明的是TensorRT C++ API，从我们获取到onnx模型开始的流程。C++ API可以通过引用头文NvInfer.h来进行访问（使用其命名空间nvinfer1），代码示例：

#include "NvInfer.h"

using namespace nvinfer1;

需要说明的是，TensorRT C++的接口类都以I为前缀开头，例如ILogger，IBuilder，等等。如果在此之前不存在，则TensorRT第一次调用CUDA时会自动创建CUDA上下文。在第一次调用TensorRT之前，最好自己创建和配置CUDA上下文。

并且由于需要展示各对象的存在周期，实例代码中没有使用智能指针，但是建议在实际使用中加上智能指针来配合TensorRT接口。

二、搭建阶段（三步走）

要创建构建器，首先必须实例化ILogger接口。这个例子捕获所有警告消息，但忽略信息性消息:

inline const char* severity_string(nvinfer1::ILogger::Severity t) {
   
	switch (t) {
   
	case nvinfer1::ILogger::Severity::kINTERNAL_ERROR: return "internal_error";
	case nvinfer1::ILogger::Severity::kERROR:   return "error";
	case nvinfer1::ILogger::Severity::kWARNING: return "warning";
	case nvinfer1::ILogger::Severity::kINFO:    return "info";
	case nvinfer1::ILogger::Severity::kVERBOSE: return "verbose";
	default: return "unknow";
	}
}

class My_Logger : public nvinfer1::ILogger           
{
   
public:
    virtual void log(Severity severity, const char* msg) noexcept override
    {
   
        // suppress info-level messages
        // 捕获所有警告类消息并输出
        if (severity <= Severity::kWARNING)
    		//

最低0.47元/天解锁文章

澄鑫

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
【TensorRT】官方文档onnx序列化教程与推理教程

需要注意的是，TensorRT网络定义的一个重要方面是它包含指向模型权重的指针，这些指针由构建器复制到优化的引擎中。由于网络是使用解析器创建的，所以解析器拥有权重占用的内存，因此在构建器运行之前，不可以删除解析器对象。并且由于需要展示各对象的存在周期，实例代码中没有使用智能指针，但是建议在实际使用中加上智能指针来配合TensorRT接口。本博客主要说明的是TensorRT C++ API，从我们获取到onnx模型开始的流程。现在，我们可以通过ONNX模型来填充网络定义，ONNX解析器API位于文件。
复制链接

扫一扫