PipeDream

本文探讨了深度学习中减少通信量的策略,如GPipe和PipeDream,它们通过pipeline并行实现计算效率提升,避免机时浪费。混合并行将PipelineParallel与DataParallel结合,自动划分提高效率。主要挑战在于权重同步和版本控制,解决方案包括权重暂存和忽略微小的权重更新差异。
摘要由CSDN通过智能技术生成

比Data parallel的通信量大幅减少;

优点:填满pipeline,减少机时浪费;

GPipe:

PipeDream: 

知识点:pipeline并行,throughtput取决于最慢的那个节点层;

混合并行:层与层用Pipeline Parallel,层内部用Data Parallel

自动划分:先在单卡上试探性跑一会儿("Profiling run"),拿到计算时间、通信时间等实际数据,再结合可以静态计算出的理论计算量、理论通信时间,决定分几节,每节多少个Data-parallel node;

难点1: Backward时,还要使用Forward时那同一份weights;

解决:Forward完立即暂存("Stash")下来weights, 供该batch Backward阶段使用;

难点2:同一个batch,在每层使用的weights, 总共更新的次数(版本号),是不同的;但因为对效果影响小,可忽略。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值