YOLOv7官方出品 Alexey Bochkovskiy操刀,精度速度超越当前所有YOLO系列

这篇博客深入探讨了YOLOv7模型的设计与训练方法,包括扩展的高效层聚合网络和基于concatenate的模型缩放。作者介绍了Planed re-parameterized convolution和标签匹配策略,以及实验中的精度与速度对比。同时,文章讨论了在TensorRT上的部署挑战,如batch_size大于1时的转换问题,并分享了相关的导出和预测经验。
摘要由CSDN通过智能技术生成

目录

开源模型信息

gpu显存查看 nvidia-smi实时刷新

yolov7 pose

tensorrt c++:

导出onnx ok

export参数:

batch_size大于1时,转trt报错:

导出onnx调研记录,包括tensorrt批量预测:

导出trt engine ok:

1模型设计

1.1、扩展的高效层聚合网络

1.2、基于concatenate模型的模型缩放

2训练方法

2.1 Planned re-parameterized convolution

2.2 标签匹配

2.3 其他Tricks

3实验

3.1 精度对比

3.2 速度精度对比

4参考


开源模型信息

s模型72m。

1060显卡 640*640 30-50ms,tensorrt 640*640 batch_size 为1时, 也是50ms左右

比yolov5s 16ms慢。

yolov7显存占用比较大,batch_size为1时占用2G,yolov5占用300M。

更改分辨率不能减小显存,能提升速度。

fp16好像也不能减小显存占用。

gpu显存查看 nvidia-smi实时刷新

gpu显存查看 nvidia-smi实时刷新_AI视觉网奇的博客-CSDN博客_nvidia-smi 实时刷新

 单图测试结果:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI算法网奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值