【论文阅读 | 异步联邦】FedLC: Accelerating Asynchronous Federated Learning in Edge Computing

向大蒜

已于 2024-05-24 22:06:47 修改

阅读量430

点赞数 5

分类专栏：联邦学习文章标签：论文阅读

于 2024-05-24 22:06:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46554918/article/details/139185545

版权

联邦学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

一句话总结：考虑计算、通信资源限制，利用需求列表动态选择 k 个进行交互的设备，最大效益实现在边缘设备间的本地协作

1. 论文信息

FedLC: Accelerating Asynchronous Federated Learning in Edge Computing，IEEE Transactions on Mobile Computing
发表时间：2024，ccfa

2. introduction

2.1. 背景：

边缘设备上的 AFL

2.2. 解决的问题：

设备异构、资源受限、non-iid data

2.3. 贡献点：

为了在 (Edge computing) EC 中实现高效的FL，设计了一种新的异步FL机制 FedLC 。从理论上分析了FedLC的收敛速度，得到了其收敛上界。给出了收敛界与参数 k（每个设备在本地协作时可以接收来自其他设备的梯度的数量）之间的定量关系。
设计了一种有效的算法来确定向每个设备发送梯度的设备集。利用需求表将发送设备的拉梯度转化为接收设备的推梯度，避免了拉操作的阻塞。
在真实世界的数据集上进行大量的实验表明 FedLC 可以加快全局模型在非i.i.d上的收敛速度。

3. 问题描述：System model/架构/对问题的形式化描述

由 Federated learning with taskonomy for non-IID data 给出结论：不同数据分布的设备之间的协作性能优于分布相似的设备之间的协作。直观地说，集群间协作的好处是向其他具有不同数据分布的设备学习，这可以通过限制局部梯度 ∇Fi 和全局梯度 ∇F 之间的差距来表示。

（6c）可以被

代替

4. 解决方法

4.1. 执行流程

计算资源约束：
确保设备 𝑖 在考虑与 𝑘 个其他设备协作时，不会超出其计算资源 𝐶𝑖 的限制。𝑐 是一个用于标准化的标量，使得
能够表示设备 𝑖 相对于某个标准量 𝑐 的计算容量。

带宽资源约束：
确保对于设备 𝑗 来说，所有其他设备 ℎ 向它发送的信息（𝑀ℎ,𝑗）的总带宽需求不超过设备 𝑗 的带宽容量 𝐵𝑗。𝑏 是一个用于标准化的标量，使得
能够表示设备 𝑗 相对于某个标准量 𝑏 的带宽容量。

设备间的协作效益评估：
猜测是
值减小，收敛界更紧（？）（较高的 𝜖 值表示梯度在设备间的一致性更高；数据分布趋于一致时，𝜉 的值会降低）

4.2. 挑战问题怎么解决：

4.2.1. 收敛界与 k 的关系

收敛界与 non-iid 度密切相关（即 ε 和 ξ )

当 non-iid 度减小，ξ 值变小，ε 值增大。因此，
的值减小，收敛界较紧
当 non-iid 度增大，ξ 值变大，ε 值减小。因此，
的值增大，收敛界较松
当所有局部数据集遵循相同的分布时，ε 和 ξ 的值都等于1，收敛界变为

4.2.2. 需求列表

Mi: : 入邻接集：矩阵M第 i 行表示需要向设备 i 发送参数的所有设备集合

M:j：出邻接集：矩阵M的第 j 列代表设备 j 需要发送梯度的所有设备集合

通过将 M 矩阵的第 j 列分发给设备 j，可以使得原本需要设备 i 主动去拉取（pull）其他设备梯度的操作，转变为设备j 主动推送（push）梯度给设备i。这样，入邻接集R（设备i需要的梯度来源）就被转换成了出邻接集V（设备j发送梯度的目标）。

消除阻塞：这种转换有助于消除由于梯度拉取操作导致的潜在阻塞问题。在异步联邦学习环境中，如果一个设备在等待另一个设备发送梯度时发生延迟，就可能造成阻塞。通过需求列表M和上述的转换，可以减少这种等待时间，因为每个设备都清楚自己需要向哪些设备发送梯度。

4.2.3. SC-FedLC（过时补偿）

为每个设备动态调整学习率来补偿模型陈旧性，考虑了每个设备对全局模型更新的贡献，并尝试通过调整学习率来平衡这种贡献，使全局模型能够更有效地融合来自不同设备的更新

参与频率 𝑟𝑖 为设备 𝑖 的本地 epoch 索引 𝑡𝑖 除以全局 epoch 索引 𝑡，即
。
全局 epoch 索引 𝑡 为所有设备本地 epoch 索引的总和，因此，所有设备的 𝑟𝑖 之和等于 1 。

结论：设备 𝑖 的学习率与其参与频率成反比，这种方法的有效性已被文献[24]所验证。（以后写自己的文章可以参考）

4.2.4. 动态调整RTO

参考TCP协议中的超时重传机制，并引入类似的方法，即在重传超时时间(RTO)内未收到服务器的应答，则重传本地模型，以应对恶劣的网络条件

RTO 的值会根据实时网络状况进行调整，以适应网络条件的变化
其中 𝜙 是网络状况的指示因子，TRTT 是平滑的往返时间，𝜎(TRTT) 是往返时间的变化量

4.3. 性能保证

假设

引理

定理

根据定理1显示收敛界与 non-iid 度密切相关（即 ε 和 ξ )。具体来说，当 non-iid 度减小，ξ 值变小，ε 值增大。因此，

的值减小，收敛界较紧，反之亦然。当所有局部数据集遵循相同的分布时，ε 和 ξ 的值都等于1，收敛界变为

η 是学习率，𝜖 是一个预定因子，𝐷 是总样本数，𝑑𝑖 是设备 𝑖 上的本地样本数，𝛽 是梯度的Lipschitz常数（即平滑度的度量），而 𝜉 是与参数 𝑘 相关的一个量，它取决于设备间梯度的多样性。

5. 效果：重点是实验设计，每一部分实验在验证论文中的什么结论

5.1. 关注的性能指标：

i) test accuracy

ii) completion time

iii) traffic consumption

5.2. 仿真实验

5.2.1. Convergence Performance

对三种数据集而言，FedLC与其他三种 baseline 比较都具有更快的收敛性能

5.2.2. Effect of Staleness Compensation

SC-FedLC优于FedLC，并且通过使用过时补偿机制减少了收敛完成时间。（SC-FedLC为陈旧的局部模型分配了更大的学习率，缓解陈旧对收敛的负面影响）

5.2.3. Impact of Non-i.i.d. Degrees

从图 4-6 可以看出，FedLC 和 SC-FedLC在三个数据集上比现有方法都好，SC-FedLC 比 FedLC 还好

5.3. 试验台实验

5.3.1. Impact of Heterogeneity Levels

在相同的训练时间下，FedLC 和 SC-FedLC 比现有的方法具有更高的测试精度（说明局部协作和过时补偿的有效性）

5.3.2. Varying the Number of Jetson Devices

随着异构程度的增加，FedLC 和 SC-FedLC 在测试精度上的增益比现有方法更高

5.3.3. Comparison of Traffic Consumption

SC-FedLC 可以在提高测试精度的同时减少完成时间，而不会显著增加通信开销，虽然没有 FedAvg 开销低，但是结合图 7 - 9 看，异步算法在时间和测试精度的平衡上做的更好

5.3.4. Effect of Timeout Retransmission

通过超时重传模型，FedLC- t从重传的模型中获得比FedLC更多的知识，（FedLC 会直接忽略超时模型，直接进行进一步的训练）

6. (备选)自己的思考

直接协作：设备间直接交换参数
中间协作：利用server
设备 𝑖 的学习率与其参与频率成反比，这种方法的有效性已被文献[24]所验证。（以后写自己的文章可以参考）

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

向大蒜 CSDN认证博客专家 CSDN认证企业博客

码龄5年

72: 原创

6万+: 周排名

2万+: 总排名

4万+: 访问

: 等级

1383: 积分

657: 粉丝

589: 获赞

33: 评论

520: 收藏

私信

关注

热门文章

分类专栏

最新评论

[论文阅读|异步FL]Asynchronous Wireless Federated Learning with Probabilistic Client Selection
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读|异步联邦】FedASMU重读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记|异步联邦】Time-Sensitive Learning for Heterogeneous Federated Edge Intelligence
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读|异步联邦】HiFlash: Communication-Efficient Hierarchical Federated Learning With Adaptive Staleness
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读 |异步联邦】GitFL: Uncertainty-Aware Real-Time Asynchronous Federated Learning using Version Control
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

向大蒜 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。