Learning For Learning:Predictive Online Control of Federated Learning with Edge Provisioning 阅读笔记
通过边缘供应对联合学习的预测在线控制——阅读笔记
摘要
论文目标:在分离的云边缘网络上以最佳的方式运行联邦学习,针对资源调度。
论文工作:
- 非线性混合整数程序,保证了模型收敛,同时降低联邦学习系统时间成本。
- 多项式在线算法
贡献程度:超过state of the art
一、论文背景、动机、主要贡献
问题背景
分布式的云边缘基础架构提供了与用户更接近的计算资源,能够支持联邦学习。
什么是联邦学习,联邦学习简介
现状:跨云网络的联邦学习运行变得至关重要。

动机
但是,服务提供商最佳地运行联邦学习作为跨用户设备,边缘和云的服务,受诸如跨层管理,边缘资源配置,边缘本地更新等因素影响,服务提供商能做到是不平凡的。
挑战:
-
平衡模型质量和资源消耗
在模型质量和资源消耗之间make trade off
-
需同时训练多模型时系统如何决策?决策需要在输入前做出
具体的输入包括:随时间变化的带宽、输入的训练数据和边缘设备的成本
先知视角?
-
无论是否实时揭示和知道输入,在线管理资源仍然很难
减少资源使用:开放/关闭边缘——切换的成本
现有的成就不足以解决:他们没有结合的考虑云边环境+联邦学习
论文贡献
首创的针对云边网络 + 联邦学习进行考量。
贡献:最大程度降低包括从设备到边缘的数据传输成本,边缘本地模型更新的计算成本,模型转移成本从边缘到云,云中全球模型聚合的计算成本以及边缘供应和切换成本。
解决方式:非线性混合整数程序,一系列多项式时间算法以在线方式
- 算法1:解决联邦学习控制决策,保持边缘设备的原有的开关状态直到达到某些条件
- 算法2:由算法1调用。它以随机的方式将差异边缘状态转换为不可或缺的ON/OFF决策,而不会违反任何约束。
- 算法3:为算法1和算法2提供反馈。实时预测输入。仅基于现有的,可观察到的输入和以前的控制决策。
二、论文问题描述和定义
系统设置和建模

云边网络
云边网络参见Fig.1.其中“边缘”是指微型数据中心或服务器群集,位于附近,区域办公室或区域办公室或地铁中心。
在一系列的epoch中研究,其中第k个epoch在边缘网络 k k k中的用户设备用 u k t u_{kt} ukt表示。
联邦学习
联邦学习三个步骤:
- 从云下载训练模型参数
- 梯度下降更新
- 上传模型参数到云,聚合更新模型
考虑本地模型和云中聚合模型的收敛性:

为达到这样的收敛精度,我们需要进行 q q q次的本地更新和 r r r次的全局更新:

控制决策
- x i j k t x_{ijkt} xijkt:在epoch t时,从用户设备i到边缘j网络k的数据比率
- y j k t y_{jkt} yjkt:是否激活epoch t中的网络k的边缘j
- η t \eta_t ηt:联邦学习本地训练的准确性
通过控制ηt,我们可以控制本地更新和全局聚合的数量
FL的代价
模型培训的成本包括三个组成部分:边缘和云之间的传输成本,云中的计算成本以及边缘的计算成本。
三个成本分别给出了计算的公式。
边缘供应的代价
维护运行边缘会产生运营成本:仅当激活边缘时,运营成本才会产生。同时,在本文中,我们允许动态打开和关闭边缘 - Toggling Edges会产生“开关成本”。
给出了运营成本的公式。
问题公式化和挑战
控制问题P
基于上述系统建模,得到下面的优化问题的模型:

问题的优化目标:优化长期的FL代价和边缘供应的代价和
问题的约束条件:
- (1):确保在用户设备上生成的数据只能将其传输到同一边缘网络中的激活边缘。
- (2):每个设备上的所有数据都会传输
- (3):变量的域
控制问题P和预测输入
条件:输入仅在做出决策之后才知晓。
后果:必须通过使用“预测”输入而不是“实际”输入来解决问题
加入预测成本后,问题目标为 P ^ \hat{P} P^:

算法目标
两个符号:
- I I I:所有变量的聚合
- I ∗ I^* I∗:离线方式下的最优解, P ∗ = P ( I ∗ ) P^*=P(I^*) P∗=P(I∗)
我们的目标是设计算法,该算法以在线方式产生预测的输入并产生解决方案̄I∧
挑战
- 离线最佳和在线预测最佳需要达到一定比值,这对在线预测算法和在线控制算法提出了要求
- 在线的不确定性:
- 问题难以求解
三、 算法设计
我们设计了三种多项式时间在线算法。
- 算法1:解决联邦学习控制决策,保持边缘设备的原有的开关状态直到达到某些条件
- 算法2:由算法1调用。它以随机的方式将差异边缘状态转换为不可或缺的ON/OFF决策,而不会违反任何约束。
- 算法3:为算法1和算法2提供反馈。实时预测输入。仅基于现有的,可观察到的输入和以前的控制决策。
挖坑待续……