【论文笔记 | 异步联邦】 FedBuff

向大蒜

已于 2024-04-22 16:15:25 修改

阅读量929

点赞数 27

分类专栏：联邦学习文章标签：论文阅读

于 2024-04-22 16:06:51 首次发布

本文链接：https://blog.csdn.net/m0_46554918/article/details/138080773

版权

联邦学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

1. 论文信息

Federated Learning with Buffered Asynchronous Aggregation，International Conference on Artificial Intelligence and Statistics，2022，ccfc

2. introduction

2.1.1. 背景：

同步 FL ，随训练过程中的客户端数量的增多，模型性能和训练速度的收益会下降，类似于大批量训练；异步 FL 缓解了 Scalability （可扩展性），但是异步 FL 来一个聚合一个，与安全聚合不兼容，会导致 Privacy 问题。

2.1.2. 挑战：Scalability、Privacy

2.1.3. 解决的问题：

Scalability：加缓冲机制优化异步聚合，具体：服务器在执行服务器更新之前将K个客户端更新聚合到安全缓冲区中
Privacy：SecAgg 使得诚实但好奇的服务器无法看到单个客户机的更新；在服务器上执行DP裁剪和噪声添加，保护客户机的数据免受基于计算的输入和输出的观察，从而提供更好的隐私-效用权衡。

2.1.4. 贡献点：

提出一种新的异步联邦优化框架FedBuff，具有 缓冲 异步聚合，通过 安全聚合 和 差分隐私 实现对诚实但好奇的威胁模型的 可扩展性 和 隐私性
给出了FedBuff在光滑非凸环境下的收敛性分析。当客户端采取Q个本地SGD步骤时，FedBuff需要的服务器迭代，以达到的准确度
实验验证 即使没有惩罚掉队者，FedBuff 也比同步FL算法效率高3.8。FedBuff 比文献中最接近的异步FL算法 FedAsync (Xie et al, 2019) 效率高2.5倍。K = 10是跨基准测试的良好设置，不需要调优
第一个提出与 SecAgg 和全局用户级 DP 兼容的异步联邦优化框架

3. Background

3.1.1. 同步FL

如图：当并发训练的用户数超过 100 时收益递减。例如，将并发性增加10倍(100 - > 1000)将使通信轮数减少不到2倍。类似于大批训练，增加批大小最终会带来递减的回报

最优的服务器学习率随着并发性的增加而增加，高并发性意味着对更多用户进行聚合，这样能够减少方差，使服务器“迈出”更大的步，减少达到目标精度所需的轮数。然而，为了获得稳定、收敛的训练结果，服务器学习率不能无限增加，并发聚合的用户数也不能无限增加；最终会饱和。

3.1.2. 异步FL

每次客户端更新完成都强制服务器更新，这样的聚合方式不满足安全聚合的条件，此外，在AsyncFL中提供用户级DP仅适用于本地差分隐私(LDP)，其中客户端剪辑模型更新并在将其发送到 Server 之前在本地添加噪声

3.1.3. SecAgg ：将单个客户端 i 的更新放在一组客户端更新的集合中，通过混淆客户端 i 和其他客户端的更新增强隐私

3.1.4. DP：先求偏导，对偏导进行裁剪得到相邻数据集，再添加噪声

DP的实现依赖于服务器使用 SecAgg

4. 问题描述：System model/架构/对问题的形式化描述

找到一个在(加权)平均值上很好地拟合所有客户数据的模型

5. 解决方法

5.1. 执行流程：

5.2. 挑战问题怎么解决：

添加缓冲机制提高可扩展性，在缓冲机制的前提下，用差分隐私实现安全聚合，提高隐私

5.3. 性能保证(performance guarantee)：理论分析，使用什么理论，怎么分析/解决

暂时先跳过

5.4. Practical Improvements

5.4.1. Staleness scaling.

控制过时度 Ti(t) 对客户端 i 更新服务器 t 的贡献影响

5.4.2. Learning rate normalization

同步与异步 FL ，两种方式对客户端来讲 round 的定义不同，但服务器规定的批处理大小 B 对所有客户端都相同。

其中

是用于该步骤的实际批处理大小

6. 效果：重点是实验设计，每一部分实验在验证论文中的什么结论

6.1. 实验设置

6.1.1. 数据集、模型、任务

Sent140是文本分类数据集(二元情感分析)

CelebA和CIFAR-10是图像分类数据集(多类分类)

对于Sent140，在660,120个客户端上训练LSTM分类器，其中每个Twitter帐户对应一个客户端。
对于CelebA，在9,343个客户端上训练与LEAF相同的卷积神经网络分类器，按照(Hsieh et al .(2020))的建议，将批处理归一化层替换为组归一化层(Wu and He(2018))
对于CIFAR-10，使用参数为0.1的Dirichlet分布生成5000个非id客户端，方法与(Hsu等)中相同
对比实验