【jetson nano】加速NanoDet

问题:

在NVIDIA Quadro P4000 GPU(显存8G)训练后,测试图片时,foward time:0.153s | decode time:0.044s | viz time:0.663s

在jetson nano 2GB部署,forward time: 51.641s | decode time: 20.472s | viz time: 2.428s

尝试使用TensorRT加速:

1、查看TensorRT版本:

dpkg -l | grep TensorRT

我的版本为7.1.3。

2、安装jetson-inference,实现pytorch模型到tensorrt模型的转换与GPU加速。

参考:https://blog.csdn.net/qianbin3200896/article/details/108949723?spm=1001.2014.3001.5502

(1)下载与编译:

git config --global http.postBuffer 524288000
git clone --recursive https://github.com/dusty-nv/jetson-inference.git

cd jetson-inference
mkdir build

cd build
cmake ../
make -j$(nproc)

(2)取消预训练模型与pytorch的安装。

(3)安装:

sudo make install 
sudo ldconfig

(4)测试,输入python3:

3、模型的转换:

(1)NanoDet模型:

参考:

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值