FetchSGD: Communication-Efficient Federated Learning with Sketching

背景

现有的联邦学习方法存在通信瓶颈和收敛性两个问题,该篇论文介绍了一种新的FL训练方法,叫做FetchSGD,旨在解决上述两个问题。

论文思想

该论文的主要思想是,用Count Sketch来对模型参数进行压缩,并且根据sketch的可合并性(mergeability)在服务器上对模型进行聚合。由于Count Sketch是线性的,因此局部模型上的momentum(不知道怎么翻译好,动量?)和error accumulation(错误累计)都会被带到服务器上,我们便可以在服务器上基于这些信息得到一个更佳的聚合模型

FL问题设置

假设一个FL系统中有 C C C个client,数据域为 Z Z Z { P } i = 1 C \{P\}_{i=1}^C {P}i=1C为在 Z Z Z上的 C C C个不相关的概率分布,并且 Z = X × Y Z = X \times Y Z=X×Y X X X是特征空间, Y Y Y是label空间,第 i i i个client上的数据集 D i D_i Di服从分布 P i P_i Pi W W W为模型的参数, L : W × Z − > R L:W \times Z->R L:W×Z>R表示损失函数,然后全局的目标函数为最小化以下的损失函数:
在这里插入图片描述
如果我们假设每一个client上的数据集大小都是一样的,那么损失函数可以简化为:
在这里插入图片描述

算法

在“论文思想”里面已经讲过,该算法的一个关键部分是对上传的模型参数进行Count Sketch来对模型参数进行压缩,解决的是通信瓶颈的问题,因为Count Sketch具有以下的可合并性:

在这里插入图片描述
那么在服务器上进行模型聚合的时候,下面等式是成立的:
在这里插入图片描述
对于一个特定的Count Sketch算子 S ( . ) S(.) S(.),会有一个相对应的解压缩算子 U ( . ) U(.) U(.)与之对应:
在这里插入图片描述
但是这种办法有一个问题:就是Top-k方法并不是一个无偏估计,那么在无偏估计下的梯度压缩方法的收敛性在使用了Top-k方法之后并不成立。为了解决这个问题,有研究指出,如果有偏差梯度压缩方法积累了由偏差梯度压缩算子产生的误差并在以后的优化中重新引入误差,则它们可以收敛,也就是我们可以通过以下办法来使得新的FL系统收敛:

在这里插入图片描述
同样,在client上的偏差压缩方法也会导致同样的问题,并且我们不方便在client上进行误差的重新引入,为了解决这个问题,我们将误差的重新引入这个步骤放到server中(因为Count Sketch方法是线性的,那么client上的误差也会带到server上来),具体步骤如下:
在这里插入图片描述
综上,整个算法如下:
在这里插入图片描述
算法解析:

  • 首先被选择的client从server下载全局模型,然后在本地训练得到新的局部模型
  • 使用Count Sketch方法对模型进行压缩,上传 S i t S_i^t Sit
  • server对上传的 S i t S_i^t Sit进行聚合,然后根据上文所讲述的方法进行client端和server端的误差重新引入
  • 根据 Δ t \Delta^t Δt更新全局模型

总结

该论文所描述的一个基本流程是:对上传的模型进行“压缩-解压缩”,然后因为在”压缩-解压缩“的过程中会造成一些信息的损失,并且导致系统难以收敛,因此使用了“误差重新引入”的方式来使得系统重新收敛。亮点在于“误差重新引入”的方法缓解了压缩模型所导致的信息损失的问题,个人觉得还是具备一些不错的启发性

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
一次性联邦聚类是一种利用异质性的方法,以获得胜利的策略。在传统的聚类任务中,数据通常集中在一个中央位置进行处理,这存在着数据隐私的风险。而一次性联邦聚类的方法通过将数据分布在不同的本地设备上进行处理,从而能够更好地保护数据隐私。 使用一次性联邦聚类的一个主要优势就是能够处理异构数据。在现实世界中,我们常常面对来自不同来源、结构和属性的数据。传统的聚类算法通常只适用于特定类型的数据,这限制了其广泛的应用。而一次性联邦聚类能够处理来自多个设备的异构数据,并在保持数据本地的同时进行聚类分析。通过融合来自不同设备的数据特征,一次性联邦聚类可以提供更全面、准确的聚类结果。 除了处理异构数据的能力,一次性联邦聚类还具有更好的数据隐私保护。在一次性联邦聚类中,本地设备上的数据不需要传输到中央位置,而是在本地进行处理。这种本地计算的方式可以降低数据隐私泄露的风险,保护用户的个人隐私。同时,一次性联邦聚类还可以采用加密和隐私保护技术,如差分隐私,进一步增强数据隐私保护。 总而言之,一次性联邦聚类是一种利用异质性的策略,能够充分利用来自多个设备的数据特征。它既可以处理来自不同来源的异构数据,又能够保护数据隐私。在当前数据驱动的社会中,一次性联邦聚类为我们提供了一种强大的工具,可以在数据分析和隐私保护方面取得重大的进展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值