BEVDet-TensorRT C++实现, Orin实现34FPS

BEVDet-TensorRT, C++实现

项目地址: github
请添加图片描述

介绍

BEVDet是一个基于BEV的多相机3D目标检测模型。本项目实现了BEVDet的C++版本,并用TensorRT加速推理。
本项目实现了:

  • 长时序(long-term)模型的推理
  • Depth模型的推理
  • 在NVIDIA A4000上,BEVDet-r50-lt-depth模型中,TRT FP32模型推理速度比PyTorch FP32模型快2.38倍, TRT FP16模型比PyTorch FP32模型快5.21倍
  • 在Jetson AGX Orin上进行推理,FP16模型推理时间在29ms左右,实现了实时化
  • 实现了Dataloader,可以在nuScenes数据集上进行测试

本项目的特点:

  • 集Resize、Crop与Normalization于一体的预处理CUDA Kernel
  • Preprocess的CUDA kernnel部分,实现了Nearest插值和Bicubic插值
  • C++与CUDA kernel实现的过往帧BEV特征对齐
  • 多线程+多数据流NvJPEG
  • Scale-NMS

推理速度

下表是BEVDet-R50-4DLongterm模型在NVIDIA A4000与Jetson AGX Orin上面的推理速度 ,模型使用前8帧的BEV Feature。

PreprocessImage stageBEV poolAlign FeatureBEV stagePostprocessmean Total
NVIDIA A4000 FP320.47816.5590.1510.8996.8480.55825.534
NVIDIA A4000 FP160.5128.6270.1680.9252.9660.61913.817
Jetson AGX Orin FP162.81617.0250.5712.1115.7470.91929.189
Jetson AGX Orin FP322.80038.090.6202.01811.8931.06555.104

参考 : https://github.com/LCH1238/bevdet-tensorrt-cpp

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值