DeepSeek 专家负载均衡器(Expert Parallelism Load Balancer (EPLB)

DeepSeek 专家负载均衡器(Expert Parallelism Load Balancer (EPLB)

当使用专家并行(EP)时,不同的专家被分配到不同的GPU。由于不同专家的负载可能会因当前工作负载而异,因此保持不同GPU的负载平衡非常重要。正如DeepSeek-V3论文中所描述的,采用冗余专家策略,复制重载专家。然后,将重复的专家打包到GPU上,以确保不同GPU之间的负载平衡。此外,由于DeepSeek-V3中使用的组限制专家路由,还尝试将同一组的专家放置到同一节点,以尽可能减少节点间的数据流量。

为了方便复制和部署,在eplb.py中开源了部署的EP负载均衡算法。该算法计算一个平衡的专家复制和放置计划的基础上估计的专家负载。请注意,预测专家负载的确切方法不在此存储库的范围内。常用的方法是使用历史统计数据的移动平均值。

负载平衡算法

负载平衡算法有两种策略,用于不同的情况。

分层负载平衡

当服务器节点数除以专家组数时, 使用分层负载均衡策略来利用组限制专家路由。 首先将专家组均匀地打包到节点上,确保不同节点的负载均衡。然后, 在每个节点内复制专家。 将复制的专家打包到各个GPU,以确保不同的GPU负载平衡。分层负载均衡策略可以在预填充阶段使用,专家并行规模较小。

全局负

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

段智华

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值