测试模型在GPU上的运行时间

最新推荐文章于 2024-07-19 19:56:43 发布

武小胖儿

最新推荐文章于 2024-07-19 19:56:43 发布

阅读量1.2k

点赞数

分类专栏： GPU

原文链接：https://deci.ai/the-correct-way-to-measure-inference-time-of-deep-neural-networks/?utm_referrer=https%3A%2F%2Ftowardsdatascience.com%2Fa-new-tool-for-analysing-neural-network-inference-performance-13cc21d2efea

版权

GPU 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

出处：https://deci.ai/the-correct-way-to-measure-inference-time-of-deep-neural-networks/?utm_referrer=https%3A%2F%2Ftowardsdatascience.com%2Fa-new-tool-for-analysing-neural-network-inference-performance-13cc21d2efea

向大佬致敬

核心代码：

model = EfficientNet.from_pretrained('efficientnet-b0')
device = torch.device("cuda")
model.to(device)
dummy_input = torch.randn(1, 3,224,224, dtype=torch.float).to(device)

# INIT LOGGERS
starter, ender = torch.cuda.Event(enable_timing=True), torch.cuda.Event(enable_timing=True)
repetitions = 300
timings=np.zeros((repetitions,1))
#GPU-WARM-UP
for _ in range(10):
    _ = model(dummy_input)
# MEASURE PERFORMANCE
with torch.no_grad():
    for rep in range(repetitions):
        starter.record()
        _ = model(dummy_input)
        ender.record()
        # WAIT FOR GPU SYNC
        torch.cuda.synchronize()
        curr_time = starter.elapsed_time(ender)
        timings[rep] = curr_time

mean_syn = np.sum(timings) / repetitions
std_syn = np.std(timings)
print(mean_syn)

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

武小胖儿 CSDN认证博客专家 CSDN认证企业博客

码龄12年

106: 原创

7万+: 周排名

9万+: 总排名

15万+: 访问

: 等级

2287: 积分

188: 粉丝

233: 获赞

23: 评论

343: 收藏

私信

关注

热门文章

分类专栏

代码 16篇
fission 1篇
docker 2篇
数据分析 3篇
科研狗的日常生活 3篇
GPU 4篇
安装 2篇
计算机系统结构 1篇
软件安装 1篇
数学 2篇
网络，应用层 1篇
算法 2篇
Java 3篇
小技能 1篇
matlab 1篇
图像处理 2篇
research 5篇
博士养成记 2篇
caffe2 4篇
tensorflow 7篇
model 1篇
parallel 1篇

最新评论

Python开发雷点总结
普通网友: 好文！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
模型推理过程中tensorboard的profiler的使用方法
qq_39504486: 你好，请问下，如果tensorflow1.14训练的模型，能用profile看嘛
nvidia Multiple Process Service (MPS)
武小胖儿: 你好，MPS下不明确设定percentage的话，默认所有进程可以使用100%的GPU资源，那么运行时间也就不会降低~详细参见MPS手册
nvidia Multiple Process Service (MPS)
米米碰碰碰: 你好，请问pytorch是否支持nvidia mps服务，我用pytorch跑多进程用GPU执行多个模型，开启mps之后时间还是没有减少
tensorflow keras权重加载过程的源码解析
word工程师: 好的，谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。