torch.cuda.synchronize()同步统计pytorch调用cuda运行时间

最新推荐文章于 2024-05-08 15:19:58 发布

菜鸟的追梦旅行

最新推荐文章于 2024-05-08 15:19:58 发布

阅读量1.2k

点赞数 5

分类专栏： cuda 文章标签： pytorch python 人工智能

原文链接：https://blog.csdn.net/weixin_44942126/article/details/117605711

版权

cuda 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

之前发现算法处理完的tensor从gpu转到cpu很耗时，一直找不到解决方法，后面看到有人说测试时间要先同步。

torch.cuda.synchronize()
start = time.time()
result = model(input)
torch.cuda.synchronize()
end = time.time()

才发现耗时的不是这个转换过程
这是因为CUDA kernel函数是异步的，所以不能直接在CUDA函数两端加上time.time()测试时间，这样测出来的只是调用CUDA api的时间，不包括GPU端运行的时间。
我们需要加上线程同步函数，等待kernel中所有线程全部执行完毕再执行CPU端后续指令。上面代码我们将同步指令加在了python端，用的是torch.cuda.synchronize函数。
其中第一次同步是为了防止前面的代码中有未同步还在GPU端运行的指令，第二次同步就是为了等result = model(input)所有线程执行完毕后再统计时间。
关于同步和异步的区别，参考下面两图
在这里插入图片描述
同步执行当调用方法执行完成后并返回结果，才能执行后续代码。

异步调用的话可参考ajax，调用方法后不会等到sum方法执行完成，而是直接执行后续代码。sum方法执行完成后主要通过状态通知主线程，或者通过回调处理这次异步方法执行的结果。
在这里插入图片描述

版权声明：本文为CSDN博主「Stars-Chan」的原创文章
原文链接：https://blog.csdn.net/weixin_44942126/article/details/117605711
参考链接：
pytorch 正确的测试时间的代码 torch.cuda.synchronize()
PyTorch自定义CUDA算子教程与运行时间分析
 同步(Synchronous)和异步(Asynchronous)

菜鸟的追梦旅行

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
torch.cuda.synchronize()同步统计pytorch调用cuda运行时间

torch.cuda.synchronize()同步统计pytorch调用cuda运行时间
复制链接

扫一扫

专栏目录

菜鸟的追梦旅行 CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

39万+: 周排名

3万+: 总排名

10万+: 访问

: 等级

2233: 积分

248: 粉丝

398: 获赞

52: 评论

624: 收藏

私信

关注

热门文章

分类专栏

ONNX部署 1篇
TensorRT教程 1篇
Python笔记 4篇
OpenCV笔记 1篇
Pytorch笔记 8篇
目标检测 11篇
模型部署 7篇
C++笔记 2篇
环境配置 5篇
ReID 3篇
cuda 1篇
深度学习 15篇

最新评论

最细致讲解yolov8模型onnx推理完整代码--(前处理，后处理)
m0_62471737: 我需要将这个项目应用到货车的重识别上，看到这个fast—reid介绍上是有工业界落地的，先试验一下效果什么样
最细致讲解yolov8模型onnx推理完整代码--(前处理，后处理)
菜鸟的追梦旅行: tranreid和其改进的几个reid模型的源码里都给了训练和评估的代码。但没有给出像fast-reid这样的可执行的demo文件。我对reid不熟悉，所以也不清楚咋改transreid，你要尝试改代码吗？
最细致讲解yolov8模型onnx推理完整代码--(前处理，后处理)
m0_62471737: 我是要做车辆重识别的，昨天看到tranreid这个模型就试了一下，看到您提出的问题正好是我需要实现的，跑了一下看到不能可视化，再加上您所说的那个问题，我就重新找了京东开源的fast—reid模型试试效果
最细致讲解yolov8模型onnx推理完整代码--(前处理，后处理)
菜鸟的追梦旅行: 这是之前看的一篇ReID的论文提出的问题，这个PFD_net的源码好像是只能在训练的数据集上测试结果，无法直接调用代码预测非论文使用的数据集的行人的特征。我请教的那个大佬也是这样回答的。因为这个模型速度太慢了，所以没有用了，还有就是感觉这个模型的代码不好改。请问你也是要用这个模型做reid吗
最细致讲解yolov8模型onnx推理完整代码--(前处理，后处理)
m0_62471737: 对于TransReID的test.py中的do_inference函数代码有些疑问？请问为何在预测推理的时候，也需要camera_id参数（相机的标签），view_id（视角的标签）参数。现在我想随意预测几张自己拍摄的行人图像（不是market1501和duke等等数据集的图像），是否也需要传参camera_id，view_id？难道使用market1501数据集训练的transreid模型，就只能推理market1501中的测试集吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。