TensorRT 基础笔记

TensorRT是NVIDIA的高性能深度学习推理加速引擎,通过算子融合、concat层消除等优化技术提高模型在GPU上的运行效率。它支持多种深度学习框架,并能将模型转换为中间表示ONNX。最新版本为2021.4.21。工作流程包括模型解析、计算图优化、序列化与反序列化,以及在执行时的资源分配。算子融合通过合并连续层减少调用开销和内存传输,而concat层消除则通过非拷贝方式减少内存访问。TensorRT还自动选择最佳算法并进行硬件优化。
摘要由CSDN通过智能技术生成

一,概述

TensorRT 是 NVIDIA 官方推出的基于 CUDAcudnn 的高性能深度学习推理加速引擎,能够使深度学习模型在 GPU 上进行低延迟、高吞吐量的部署。采用 C++ 开发,并提供了 C++Python 的 API 接口,支持 TensorFlow、Pytorch、Caffe、Mxnet 等深度学习框架,其中 MxnetPytorch 的支持需要先转换为中间模型 ONNX 格式。截止到 2021.4.21 日, TensorRT 最新版本为 v7.2.3.4

延迟和吞吐量的一般解释:

  • 延迟 (Latency): 指执行一个操作所花的时间。
  • 吞吐量 (Throughput): 在单位时间内,可执行的运算次数。

二,TensorRT 工作流程

在描述 TensorRT 的优化原理之前,需要先了解 TensorRT 的工作流程。首先输入一个训练好的 F

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嵌入式视觉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值