TensorRT部署中函数解析

初步学习TensorRT部署的时候,遇到很多不知道什么意思的函数,这里用来纪录一下

  1. ICudaEngine::getNbBindings():获取与这个engine相关的输入输出的tensor的数量,不过在TensorRT 8.5中被弃用,ICudaEngine::getNbIOTensors替代使用
  2. ICudaEngine::getNbIOTensors: 文档中的解释很清楚,It is the number of input and output tensors for the network from which the engine was built
  3. ICudaEngine::getBindingIndex : 输入参数是(char const* name) ,检索命名张量的绑定索引。engine建立的时候,是把tensor的名字和在张量中的所以对应起来的。但是这个函数也是在TensorRT 8.5中被弃用。
  4. cudamalloc: 在GPU设备内存上分配内存。需要指定要分配的字节数。返回一个指向device内存的指针。
  5. cudaStreamCreate:CUDA中的流(stream)表示一个GPU操作队列,该队列中的操作将以添加到流中的先后顺序而依次执行。可以将一个流看做是GPU上的一个任务,不同的流(即不同的任务)可以并行执行。这种并行性允许在同一设备上的多个操作重叠执行,从而提高了GPU的利用率和程序的执行效率。
  6. cudaMemcpyAsync:用于在主机(CPU)和设备(GPU)之间异步传输数据。它可以在主机和设备之间进行内存复制操作,而不会阻塞主机线程的执行。
  7. cudaStreamSynchronize:这个函数会阻塞主机代码的执行,直到指定的流中的所有之前的异步操作都完成。这样可以确保在继续执行主机代码之前,所有之前的设备操作都已经完成。
  8. IExecutionContext::enqueue: 前向推理,最老的API,支持隐式批处理,已经被弃用了
  9. IExecutionContext::enqueueV2: 前向推理,enqueue的替代,支持显式批处理,已经被弃
  10. IExecutionContext::enqueueV3: 前向推理,最新的API,支持依赖数据的形状,推荐使用
    在这里插入图片描述
  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值