Jetson NX和Nano上使用TensorRT部署YOLOv4模型速度测试

本文通过对比Jetson Xavier NX和Jetson Nano的CUDA算力,并进行TensorRT加速下的YOLOv4模型推理测试,探讨两者在实际应用中的性能差异。实验结果显示了不同分辨率和精度下模型的运行速度和效率。
摘要由CSDN通过智能技术生成

Jetson板卡算力对比 以及NX和Nano板卡上TensorRT加速测试

前言

  以下所有测试基于enazoe大佬的yolo-tensorrt项目进行,坏境配置比较简单。
  简单测试一下YOLOv4模型在NX和Nano上的推理速度,实际推理速度可能会有波动,如发现问题欢迎大家交流!

Jetson CUDA 算力表:

GPU浮点算力(FP16)整点算力(INT8)Compute Capability
Jetson AGX Xavier11 TFLOPS32 TOPS7.2
Jetson Xavier NX6 TFLOPS21 TOPS7.2
Jetson TX21.3 TFLOPS不支持6.2
Jetson Nano0.5 TFLOPS不支持5.3

Xavier NX 上TensorRT测试:

模型输入尺寸加速精度单帧耗时FPS
YOLOv4608X608FP322005
FP169011
INT86012.5
416X416FP321109
FP165518
INT84522
模型输入尺寸加速精度单帧耗时FPS
YOLOv4-tiny608X608FP323528
FP162540
INT82050
416X416FP322050
FP161566
INT81566

Nano上TensorRT推理测试:

模型输入尺寸加速精度单帧耗时FPS
YOLOv4608X608FP327601.3
FP165701.7
416X416FP323772.6
FP162753.6
模型输入尺寸加速精度单帧耗时FPS
YOLOv4-tiny608X608FP3210010
FP167014.2
416X416FP325020
FP163528.6
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值