TensorRT深度学习推理框架介绍

最新推荐文章于 2024-06-13 10:15:12 发布

linolzhang

最新推荐文章于 2024-06-13 10:15:12 发布

阅读量1.9w

点赞数 8

分类专栏：深度学习文章标签：深度学习 tesorrt deepstream GIE inference

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linolzhang/article/details/79079863

版权

一. 产生背景

深度学习的发展带动了一批深度学习框架，caffe、tensorflow、pytorch等，对于计算量庞大的CNN，效率一直是大家所关注的，接触过深度网络压缩的同学应该知道网络压缩最关键的两个思路，剪枝和量化。

TensorRT就是量化，将FP32位权值数据优化为 FP16 或者 INT8，而推理精度不发生明显的降低。

关于TensorRT首先要清楚以下几点：

1. TensorRT是NVIDIA开发的深度学习推理工具，只支持推理，不支持训练；

目前TensorRT3已经支持Caffe、Caffe2、TensorFlow、MxNet、Pytorch等主流深度学习库；

2. TensorRT底层针对NVIDIA显卡做了多方面的优化，不仅仅是量化，可以和 CUDA CODEC SDK 结合使用，

也就是另一个开发包DeepStream；

3. TensorRT独立于深度学习框架，通过解析框架文件来实现，不需要额外安装DL库；

参考示意图：

二. 使用TensorRT

上面是TensorRT的介绍，也可以参考官方文档，更权威一些：https://developer.nvidia.com/tensorrt

下面以Caffe为例介绍TensorRT的使用：

1. caffeToGIEModel －将 caffe model 转换到 TensorRT 格式

＋ void caffeToGIEModel( const std::string& deployFile,

最低0.47元/天解锁文章

关注

8
点赞
踩
29

收藏

觉得还不错? 一键收藏
2
评论
TensorRT深度学习推理框架介绍

一. 产生背景深度学习的发展带动了一批深度学习框架，caffe、tensorflow、pytorch等，对于计算量庞大的CNN，效率一直是大家所关注的，接触过深度网络压缩的同学应该知道网络压缩最关键的两个思路，剪枝和量化。 TensorRT就是量化，将FP32位权值数据优化为 FP16 或者 INT8，而推理精度不发生明显的降低。关于TensorRT首先要...
复制链接

扫一扫

专栏目录

博客等级

码龄8年

博客专家认证

177
原创

1070
点赞

2646
收藏

2130
粉丝

关注

私信

热门文章

分类专栏

最新评论

C++基础学习之15 - 消息机制
莫西小磊Elias: 请教一下这句话【回调函数必须是静态函数或者全局函数，从而确保唯一的入口地址。】在我看来，非静态成员函数的入口地址也是唯一的。
数学回味系列之7 - 鸡兔同笼问题
知安: 能不能用Python写呀？
牛顿法与Hessian矩阵
Dtouch_: 请问解决了吗，我也有一样的疑惑
人群密度估计-Crowd Density
德彪稳坐倒骑驴: 写的很好，我做了许多笔记，收益良多，
深度学习的研究方向和发展趋势
HernyChou886: 我想问下，文章里说道的读论文，共享的翻译论文怎么找

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。