mmdetection测试模型显存占用与推理速度

最新推荐文章于 2024-07-04 14:12:38 发布

Marsysh

最新推荐文章于 2024-07-04 14:12:38 发布

阅读量3.8k

点赞数 2

分类专栏： mmdetection

本文链接：https://blog.csdn.net/yshMars/article/details/120652476

版权

MMDetection 显存监控推理速度 torch.cuda.synchronize multi_gpu_test

关键词由CSDN通过智能技术生成

mmdetection 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

mmdetection版本：2.11.0

显存占用

跑起模型推理后实时监控显存占用

watch -n .5 nvidia-smi

推理速度

mmdetection/tools/test.py

看你的程序走的是single_gpu_test还是multi_gpu_test。在具体工程中，一般都是多卡训的，就算你是用的单卡来测速度和显存，也是走的multi_gpu_test。

if not distributed:
	model = MMDataParallel(model, device_id=[0])
	outputs = single_gpu_test(model, dataloader, args.tmpdir, args.show_score_thr)
else:
	model = MMDataParallel(
		model.cuda(),
		devices_id=[torch.cuda.current_device()],
		broadcast_buffers=False)
	outputs = multi_gpu_test(model, data_loader,  args.tmpdir, args.show_score_thr)

*mmdetection/mmdet/apis/test.py

以multi_gpu_test为例。
找到：

result = model(return_loss=False, rescale=True, **data)

改为：

torch.cuda.synchronize()
start = time.time()
result = model(return_loss=False, rescale=True, **data)
torch.cuda.synchronize()
end = time.time()
print(end - start, "s")

单位为秒s。
因为pytorch中程序的执行是异步的，因此

torch.cuda.synchronize()

是必须加的，要不然结果会有问题。

Marsysh

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
mmdetection测试模型显存占用与推理速度

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar
复制链接

扫一扫

专栏目录