b站TensorRT官方教程学习笔记
0.简述
1. Part1 TensorRT 简介
1.1 TensorRT 简介
- 用于高效实现已训练好的深度学习模型的推理过程的SDK
- 内含推理优化器和运行时环境
- 使DL模型能以更高吞吐量和更低的延时运行
- 有C++ Python的API,完全等价可以混用
1.1.1 TensorRT基本特性和用法
TensorRT表现:
- 不同模型加速效果不同
- 选用高效算子提升运算效率
- 算子融合减少访存数据、提高访问效率
- 使用低精度数据类型,节约时间空间
1.1.2 TensorRT基本流程
构建期:
-前期准备:日志记录器、计算图构建器、构建器的配置器、动态输入下配置器
运行期:
- 建立计算图的可执行程序Engine ,以及运行此程序的上下文Context,类比CPU进程的概念
1.1.3 TensorRT上搭建模型方法
训练好的网络如何在TensorRT上搭建
1.1.3.1 Workflow:使用TensorRT API搭建
1.1.3.1.1 Logger日志记录器
1.1.3.1.2 Builder引擎构建器
就是权重迁移和逐层加载
FP16模式
Int8模式
怎么让一个Network跑起来
TensorRT运行期技术
Engine计算引擎