Segformer双显卡推理速度测试

1、4080单显卡和双显卡同步并行推理平均耗时分别为360ms600ms;双显卡速度明显比单显卡的速度快

2、两个相机间隔500ms的并行推理耗时,单双显卡推理平均耗时为340ms

3、4080双显卡和4070双显卡同步并行推理平均耗时分别为360ms380ms;40804070的速度快20ms

YOLOv9(You Only Look Once version 9)是一个先进的物体检测模型,它基于YOLO系列算法,通常用于实时图像和视频的目标检测任务。要在Python中测试YOLOv9的推理速度,你需要使用相关的深度学习库如PyTorch或TensorFlow,以及YOLOv9的预训练权重文件。 以下是一个简单的例子,展示如何使用PyTorch框架在GPU上测量YOLOv9的速度: ```python import torch from torchvision import models from PIL import Image # 加载预训练的YOLOv9模型(假设已经下载并解压到models目录) model = models.yolov9(pretrained=True) # 将模型放到GPU上,如果可用的话 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') model.to(device) # 测试图片路径 image_path = 'path_to_your_image.jpg' # 图像预处理 img = Image.open(image_path) img = img.resize((640, 640)) # YOLOv9默认输入尺寸 img = img.to(device).unsqueeze(0) # 添加批次维度 # 开始计时 start_time = torch.cuda.Event(enable_timing=True) end_time = torch.cuda.Event(enable_timing=True) # 假设model.forward()返回预测结果 with torch.no_grad(): start_time.record() output = model(img) end_time.record() # 等待所有计算完成 torch.cuda.synchronize() # 计算时间 inference_time = start_time.elapsed_time(end_time) / 1e3 # 单位为毫秒 print(f"YOLOv9的推理速度大约是 {inference_time:.2f} ms") ``` 请注意,这只是一个基本示例,实际测试推理速度可能会因为模型复杂度、硬件性能、数据加载等因素有所不同,并需要多次运行求平均值以获得更准确的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值