理解torch.distributed.barrier()

最新推荐文章于 2024-07-23 19:29:50 发布

Cosmos Tan

最新推荐文章于 2024-07-23 19:29:50 发布

阅读量2.8k

点赞数 3

分类专栏： Pytorch 文章标签：深度学习 pytorch 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tanqy1997/article/details/124677130

版权

Pytorch 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

if args.local_rank not in [-1, 0]:
        torch.distributed.barrier()  # Make sure only the first process in distributed training will download model & vocab

        ... (loads the model and the vocabulary)

    if args.local_rank == 0:
        torch.distributed.barrier()  # Make sure only the first process in distributed training will download model & vocab

理解：

四个进程（0，1, 2 ，3）多卡训练模型时都是同步并行的，但是在读取数据，数据预处理等操作是不需要并行做的。一般只需要主进程（local_rank = 0）进行这些操作。

在执行到第一个if语句，其他进程（local_rank != 0）会被阻塞。主进程执行后面操作。直到执行第二个if语句时，主进程也被阻塞。当所有进程都被阻塞时，torch.distributed.barrier()会释放所有进程。

参考：GitHub - jia-zhuang/pytorch-multi-gpu-training: 整理 pytorch 单机多 GPU 训练方法与原理整理 pytorch 单机多 GPU 训练方法与原理. Contribute to jia-zhuang/pytorch-multi-gpu-training development by creating an account on GitHub.https://github.com/jia-zhuang/pytorch-multi-gpu-training

pytorch - How does torch.distributed.barrier() work - Stack Overflowhttps://stackoverflow.com/questions/59760328/how-does-torch-distributed-barrier-work

Distributed communication package - torch.distributed — PyTorch 1.11.0 documentation

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Cosmos Tan CSDN认证博客专家 CSDN认证企业博客

码龄7年

84: 原创

7万+: 周排名

50万+: 总排名

17万+: 访问

: 等级

1534: 积分

39: 粉丝

76: 获赞

29: 评论

361: 收藏

私信

关注

分类专栏

最新评论

pconsc4 安装
weixin_41857049: hello您好，我想请问，我gcc和g++都安装了，还是报您第一张图片显示的错误，请问您之前遇到过这个问题吗？
Singularity实践教程 + Docker 转 Singularity 的避坑指南
Cosmos Tan: 你好，确定一下在使用的是哪一种shell, sh, bash。并查看一下路径是否存在，然后到官网，或github下查一下。
Singularity实践教程 + Docker 转 Singularity 的避坑指南
一只青橘子: 你好，我singularity shell一直报错是怎么回事
理解torch.distributed.barrier()
Cosmos Tan: 你好，不好意思，我目前没遇到，好久没有多卡训练了。
理解torch.distributed.barrier()
只会划水的小白: 你好作者大大，我使用barrier()的时候，进程依然能够继续往下执行，查了一下说可能是多线程问题？请问你遇到过吗？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。