TensorRT部署中函数解析

初步学习TensorRT部署的时候,遇到很多不知道什么意思的函数,这里用来纪录一下

  1. ICudaEngine::getNbBindings():获取与这个engine相关的输入输出的tensor的数量,不过在TensorRT 8.5中被弃用,ICudaEngine::getNbIOTensors替代使用
  2. ICudaEngine::getNbIOTensors: 文档中的解释很清楚,It is the number of input and output tensors for the network from which the engine was built
  3. ICudaEngine::getBindingIndex : 输入参数是(char const* name) ,检索命名张量的绑定索引。engine建立的时候,是把tensor的名字和在张量中的所以对应起来的。但是这个函数也是在TensorRT 8.5中被弃用。
  4. cudamalloc: 在GPU设备内存上分配内存。需要指定要分配的字节数。返回一个指向device内存的指针。
  5. cudaStreamCreate:CUDA中的流(stream)表示一个GPU操作队列,该队列中的操作将以添加到流中的先后顺序而依次执行。可以将一个流看做是GPU上的一个任务,不同的流(即不同的任务)可以并行执行。这种并行性允许在同一设备上的多个操作重叠执行,从而提高了GPU的利用率和程序的执行效率。
  6. cudaMemcpyAsync:用于在主机(CPU)和设备(GPU)之间异步传输数据。它可以在主机和设备之间进行内存复制操作,而不会阻塞主机线程的执行。
  7. cudaStreamSynchronize:这个函数会阻塞主机代码的执行,直到指定的流中的所有之前的异步操作都完成。这样可以确保在继续执行主机代码之前,所有之前的设备操作都已经完成。
  8. IExecutionContext::enqueue: 前向推理,最老的API,支持隐式批处理,已经被弃用了
  9. IExecutionContext::enqueueV2: 前向推理,enqueue的替代,支持显式批处理,已经被弃
  10. IExecutionContext::enqueueV3: 前向推理,最新的API,支持依赖数据的形状,推荐使用
    在这里插入图片描述
  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TensorRT是NVIDIA推出的用于高性能推断的深度学习优化器和运行时引擎。它可以针对深度神经网络模型进行优化,从而加速模型的推理过程。在TensorRT部署ResNet网络可以按照以下步骤进行: 1. 生成ONNX文件:首先,将ResNet模型转换为ONNX格式。使用PyTorch官方提供的torch.onnx.export()函数可以将模型转换为ONNX文件。在转换过程,需要指定输入的维度和模型的权重等信息。 2. 创建推理引擎:接下来,使用TensorRT的API来创建推理引擎。可以使用TensorRT的Builder和Network类来构建网络结构,并设置优化参数和推理选项。 3. 编译和优化:在创建网络结构后,需要使用TensorRT的Builder类将网络编译为可执行的推理引擎。在此过程TensorRT会对网络进行优化,包括融合卷积、批量归一化和激活函数等操作,以提高推理性能。 4. 推理:最后,使用生成的推理引擎对输入数据进行推理。可以将输入数据传递给推理引擎,并获取输出结果。 需要注意的是,部署TensorRT需要在系统安装相应的软件和依赖库,如CUDA和TensorRT。在Windows 10系统上完成部署时,需要确保软件和依赖包的正确安装和配置。 总结来说,TensorRT部署ResNet网络的过程包括ONNX文件的生成、推理引擎的创建、编译和优化以及最后的推理过程。这样可以提高模型的推理性能,并加速图片分类项目的部署。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [tensorRT部署resnet网络Python、c++源码](https://download.csdn.net/download/matlab_xiaogen/86404017)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [TensorRT部署总结(一)](https://blog.csdn.net/qq_23022733/article/details/124566752)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值