使用NVIDIA 免费工具TENSORRT 加速推理实践--YOLOV3目标检测

本文介绍了如何使用NVIDIA的TensorRT工具优化YOLOV3目标检测模型的推理速度。在Tx1硬件上,未使用TensorRT时帧率为1FPS,而使用后提升至4.6FPS。TensorRT通过低精度数据类型、动态张量内存管理和网络层融合等手段优化性能。文章还详细阐述了TensorRT的工作流程,并提供了相关代码资源和DeepStream的使用情况。
摘要由CSDN通过智能技术生成

使用NVIDIA 免费工具TENSORRT 加速推理实践–YOLOV3目标检测
在这里插入图片描述
tensorRT5.0之前主要支持计算机视觉类的模型,现在已经升级到TensorRT7.0 ,对语音、语义、自然语言处理等方向的模型也能提供很好的支持。
在这里插入图片描述
Nvidia TensorRT 是一种**高性能深度学习推理优化器和运行时加速库 ** ,可为深度学习推理应用程序提供低延迟和高吞吐量。应用场景主要是由于在嵌入式或移动端的GPU性能比较紧张,比如Nano,又希望能够保证快速的推理计算能力。
在这里插入图片描述
介绍YoloV3 在没有使用TensorRT和使用TensorRT的对比效果,这里使用的硬件是Tx1,设置batchsize=1,如果没有使用TensorRT 的情况下基本帧率是1FPS,在使用TensorRT的情况下是4.6FPS,提升效果在4倍以上。当batchsize设置的更大的话,tensorRT加速效果更好,作者尝试最多加速到14FPS。

在这里插入图片描述

使用传统框架和使

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值