TensorRT介绍

最新推荐文章于 2023-01-11 21:57:40 发布

Chaseliu1989

最新推荐文章于 2023-01-11 21:57:40 发布

阅读量364

点赞数

分类专栏： TensorRT 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43880935/article/details/104544654

版权

TensorRT是一个高性能深度学习推理优化器，用于提供低延迟、高吞吐量的推理部署，支持多种深度学习框架。它通过优化模型，提高在NVIDIA GPU上的推理速度，特别适合对实时性要求高的应用，如自动驾驶。TensorRT包含C++和Python API，能够将其他框架如Caffe、TensorFlow的模型转换并进行优化。ONNX作为通用的神经网络模型交换格式，促进了不同框架之间的兼容性。

摘要由CSDN通过智能技术生成

引用：https://www.cnblogs.com/qccz123456/p/11767858.html
1 简介
TensorRT是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxnet、Pytorch等几乎所有的深度学习框架，将TensorRT和NVIDIA的GPU结合起来，能在几乎所有的框架中进行快速和高效的部署推理。

TensorRT 是一个C++库，从 TensorRT 3 开始提供C++ API和Python API，主要用来针对 NVIDIA GPU进行高性能推理（Inference）加速。现在最新版TensorRT是4.0版本。

TensorRT 之前称为GIE。

关于推理（Inference）：

训练（training）和推理（inference）的区别：

训练（training）包含了前向传播和后向传播两个阶段，针对的是训练集。训练时通过误差反向传播来不断修改网络权值（weights）。
推理（inference）只包含前向传播一个阶段，针对的是除了训练集之外的新数据。可以是测试集，但不完全是，更多的是整个数据集之外的数据。其实就是针对新数据进行预测，预测时，速度是一个很重要的因素。
一般的深度学习项目ÿ

最低0.47元/天解锁文章

Chaseliu1989

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
TensorRT介绍

引用：https://www.cnblogs.com/qccz123456/p/11767858.html1 简介TensorRT是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxnet、Pyto...
复制链接

扫一扫