jetson tx2 上部署TensorRT模型推理

最新推荐文章于 2024-06-02 16:57:19 发布

菜菜菜菜菜菜菜

最新推荐文章于 2024-06-02 16:57:19 发布

阅读量7.3k

点赞数 8

分类专栏： jetson tx2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43590290/article/details/96990630

版权

参考：https://arleyzhang.github.io/articles/7f4b25ce/

1. Jetson tx2 是什么？

Jetson tx2简而言之就是AI计算终端，采用 NVIDIA Pascal™ 构架，外形小巧、节能高效，非常适合机器人、无人机、智能摄像机和便携医疗设备等智能边缘终端设备。

2. TensorRT是什么？

TensorRT是一个高性能的深度学习推理（Inference）优化器，可以为深度学习应用提供低延迟、高吞吐率的部署推理。TensorRT可用于对超大规模数据中心、嵌入式平台或自动驾驶平台进行推理加速。TensorRT现已能支持TensorFlow、Caffe、Mxnet、Pytorch等几乎所有的深度学习框架，将TensorRT和NVIDIA的GPU结合起来，能在几乎所有的框架中进行快速和高效的部署推理。
TensorRT 是一个C++库，从 TensorRT 3 开始提供C++ API和Python API，主要用来针对 NVIDIA GPU进行高性能推理（Inference）加速。
在这里插入图片描述

由以上两张图可以很清楚的看出，训练（training）和推理（inference）的区别：

训练（training）： 包含了前向传播和后向传播两个阶段，针对的是训练集。训练时通过误差反向传播来不断修改网络权值（weights）。
推理（inference）： 只包含前向传播一个阶段，针对的是除了训练集之外的新数据。可以是测试集，但不完全是，更多的是整个数据集之外的数据。其实就是针对新数据进行预测，预测时，速度是一个很重要的因素。

一般的深度学习项目，训练时为了加快速度，会使用多GPU分布式训练。但在部署推理时，为了降低成本，往往

最低0.47元/天解锁文章

菜菜菜菜菜菜菜

关注

8
点赞
踩
59

收藏

觉得还不错? 一键收藏
打赏
3
评论
jetson tx2 上部署TensorRT模型推理

1## 标题 jetson tx2 是什么？jetson tx2简而言之就是
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

菜菜菜菜菜菜菜 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。