目录
2.1 Planned re-parameterized convolution
开源模型信息
s模型72m。
1060显卡 640*640 30-50ms,tensorrt 640*640 batch_size 为1时, 也是50ms左右
比yolov5s 16ms慢。
yolov7显存占用比较大,batch_size为1时占用2G,yolov5占用300M。
更改分辨率不能减小显存,能提升速度。
fp16好像也不能减小显存占用。
gpu显存查看 nvidia-smi实时刷新
gpu显存查看 nvidia-smi实时刷新_AI视觉网奇的博客-CSDN博客_nvidia-smi 实时刷新
单图测试结果: