torch.cuda.synchronize()

最新推荐文章于 2024-05-08 15:19:58 发布

桃汽宝

最新推荐文章于 2024-05-08 15:19:58 发布

阅读量2.6w

点赞数 57

分类专栏： Pytorch 文章标签： python 深度学习

原文链接：https://blog.csdn.net/u013548568/article/details/81368019

版权

Pytorch 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

torch.cuda.synchronize（）

torch.cuda.synchronize()
测试时间的代码

torch.cuda.synchronize()

等待当前设备上所有流中的所有核心完成。

测试时间的代码

代码1

start = time.time()
result = model(input)
end = time.time()

代码2

torch.cuda.synchronize()
start = time.time()
result = model(input)
torch.cuda.synchronize()
end = time.time()

代码2是正确的。因为在pytorch里面，程序的执行都是异步的。
如果采用代码1，测试的时间会很短，因为执行完end=time.time()程序就退出了，后台的cu也因为python的退出退出了。
如果采用代码2，代码会同步cu的操作，等待gpu上的操作都完成了再继续成形end = time.time()

代码3

start = time.time()
result = model(input)
print(result)
end = time.time()

如果将代码1改为代码3 ，代码3和代码2的时间是类似的。
因为代码3会等待gpu上的结果执行完传给print函数，所以时间就和代码2同步的操作的时间基本上是一致的了。
将print(result)换成result.cpu()结果是一致的。

桃汽宝

关注

57
点赞
踩
81

收藏

觉得还不错? 一键收藏
6
评论
torch.cuda.synchronize()

torch.cuda.synchronize（）torch.cuda.synchronize()测试时间的代码代码1代码2代码3torch.cuda.synchronize()等待当前设备上所有流中的所有核心完成。测试时间的代码代码1start = time.time()result = model(input)end = time.time()代码2torch.cuda.sy...
复制链接

扫一扫