TensorRT教程2：工作流程

最新推荐文章于 2024-05-28 14:47:52 发布

米斯特龙_ZXL

最新推荐文章于 2024-05-28 14:47:52 发布

阅读量1.3k

点赞数 7

分类专栏： TensorRT教程文章标签：深度学习神经网络 pytorch tensorflow caffe

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41562691/article/details/118277497

版权

TensorRT教程专栏收录该内容

20 篇文章 117 订阅

订阅专栏

TensorRT工作流程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kqws7AXJ-1624787886267)(1-1 TensorRT精华总结.assets/image-20210625122719532.png)]

1、转换和部署模型5个基本步骤

step1：获取模型

step2：选择batchsize

step3：选择精度

step4：模型转换

step5：模型部署

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rFvf7Qh2-1624787886269)(1-1 TensorRT精华总结.assets/image-20210622144024833.png)]

2、转换模型的3个主要选择

使用TF-TRT

易于使用，可以避免自己写插件层，未达到最佳效率,TF-TRT 通常比直接使用 ONNX 或 C++ API 慢

使用trtexec转换 ONNX

最高效，使用trtexec，不支持的层要自己写插件层

使用TensorRT网络定义 API

用C++ API 或 Python API 手动构建网络具有最佳性能和可定制性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-osDwIpRS-1624787886271)(1-1 TensorRT精华总结.assets/image-20210613130036232.png)]

3、部署模型的3个主要选择

使用Tensorflow部署

TF-TRT 通常比直接使用 ONNX 或 C++ API 慢

使用独立的 TensorRT 运行时 API

C++ API 通常是运行 TensorRT 引擎的性能最高的选项，开销最少

Python API您可以接受一些性能开销，主要好处是数据预处理和后处理易于使用，因为您可以使用各种库，如 NumPy 和 SciPy。

使用 NVIDIA Triton 推理服务器

您想通过 HTTP 或 gRPC 为您的模型提供服务

4、选择合适的工作流程

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NfdytjAg-1624787886272)(1-1 TensorRT精华总结.assets/image-20210621161717919.png)]

米斯特龙_ZXL

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
1
评论
TensorRT教程2：工作流程

TensorRT工作流程1、转换和部署模型5个基本步骤step1：获取模型step2：选择batchsizestep3：选择精度step4：模型转换step5：模型部署2、转换模型的3个主要选择使用TF-TRT易于使用，可以避免自己写插件层，未达到最佳效率,TF-TRT 通常比直接使用 ONNX 或 C++ API 慢使用trtexec转换 ONNX最高效，使用trtexec，不支持的层要自己写插件层使用TensorRT网络定义 API用C++ API 或 Python API
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

米斯特龙_ZXL 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。