通过边缘供应对联合学习的预测在线控制——阅读笔记

Blanche117

于 2022-10-23 22:58:53 发布

阅读量568

点赞数

分类专栏：分布式机器学习文章标签：学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45745854/article/details/127482956

版权

分布式机器学习专栏收录该内容

6 篇文章

订阅专栏

这篇博客探讨了如何在云边缘网络上有效地运行联邦学习，提出了一种非线性混合整数程序和多项式时间在线算法，旨在平衡模型质量和资源消耗。论文关注点在于资源调度，包括数据传输、边缘计算和云聚合成本。通过实时预测输入，算法解决了在线控制问题，同时考虑了边缘供应的开销和切换成本。算法设计包括用于控制决策、状态转换和输入预测的三个部分，旨在实现接近离线最优的在线性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Learning For Learning：Predictive Online Control of Federated Learning with Edge Provisioning 阅读笔记

通过边缘供应对联合学习的预测在线控制——阅读笔记

摘要

论文目标：在分离的云边缘网络上以最佳的方式运行联邦学习，针对资源调度。

论文工作：

非线性混合整数程序，保证了模型收敛，同时降低联邦学习系统时间成本。
多项式在线算法

贡献程度：超过state of the art

一、论文背景、动机、主要贡献

问题背景

分布式的云边缘基础架构提供了与用户更接近的计算资源，能够支持联邦学习。

什么是联邦学习，联邦学习简介

现状：跨云网络的联邦学习运行变得至关重要。

动机

但是，服务提供商最佳地运行联邦学习作为跨用户设备，边缘和云的服务，受诸如跨层管理，边缘资源配置，边缘本地更新等因素影响，服务提供商能做到是不平凡的。

挑战：

平衡模型质量和资源消耗

在模型质量和资源消耗之间make trade off
需同时训练多模型时系统如何决策？决策需要在输入前做出

具体的输入包括：随时间变化的带宽、输入的训练数据和边缘设备的成本

先知视角？
无论是否实时揭示和知道输入，在线管理资源仍然很难

减少资源使用：开放/关闭边缘——切换的成本

现有的成就不足以解决：他们没有结合的考虑云边环境+联邦学习

论文贡献

首创的针对云边网络 + 联邦学习进行考量。

贡献：最大程度降低包括从设备到边缘的数据传输成本，边缘本地模型更新的计算成本，模型转移成本从边缘到云，云中全球模型聚合的计算成本以及边缘供应和切换成本。

解决方式：非线性混合整数程序，一系列多项式时间算法以在线方式

算法1：解决联邦学习控制决策，保持边缘设备的原有的开关状态直到达到某些条件
算法2：由算法1调用。它以随机的方式将差异边缘状态转换为不可或缺的ON/OFF决策，而不会违反任何约束。
算法3：为算法1和算法2提供反馈。实时预测输入。仅基于现有的，可观察到的输入和以前的控制决策。

二、论文问题描述和定义

系统设置和建模

云边网络

云边网络参见Fig.1.其中“边缘”是指微型数据中心或服务器群集，位于附近，区域办公室或区域办公室或地铁中心。

在一系列的epoch中研究，其中第k个epoch在边缘网络 $k$ 中的用户设备用 $u_{kt}$ 表示。

联邦学习

联邦学习三个步骤：

从云下载训练模型参数
梯度下降更新
上传模型参数到云，聚合更新模型

考虑本地模型和云中聚合模型的收敛性：

为达到这样的收敛精度，我们需要进行 $q$ 次的本地更新和 $r$ 次的全局更新：

控制决策

$x_{ijkt}$ ：在epoch t时，从用户设备i到边缘j网络k的数据比率
$y_{jkt}$ ：是否激活epoch t中的网络k的边缘j
$\eta_t$ ：联邦学习本地训练的准确性

通过控制ηt，我们可以控制本地更新和全局聚合的数量

FL的代价

模型培训的成本包括三个组成部分：边缘和云之间的传输成本，云中的计算成本以及边缘的计算成本。

三个成本分别给出了计算的公式。

边缘供应的代价

维护运行边缘会产生运营成本：仅当激活边缘时，运营成本才会产生。同时，在本文中，我们允许动态打开和关闭边缘 - Toggling Edges会产生“开关成本”。

给出了运营成本的公式。

问题公式化和挑战

控制问题P

基于上述系统建模，得到下面的优化问题的模型：

问题的优化目标：优化长期的FL代价和边缘供应的代价和

问题的约束条件：

（1）：确保在用户设备上生成的数据只能将其传输到同一边缘网络中的激活边缘。
（2）：每个设备上的所有数据都会传输
（3）：变量的域

控制问题P和预测输入

条件：输入仅在做出决策之后才知晓。

后果：必须通过使用“预测”输入而不是“实际”输入来解决问题

加入预测成本后，问题目标为 $\hat{P}$ ：

算法目标

两个符号：

$I$ ：所有变量的聚合
$I^*$ ：离线方式下的最优解， $P^*=P(I^*)$

我们的目标是设计算法，该算法以在线方式产生预测的输入并产生解决方案̄I∧

挑战

离线最佳和在线预测最佳需要达到一定比值，这对在线预测算法和在线控制算法提出了要求
在线的不确定性：
问题难以求解

三、算法设计

我们设计了三种多项式时间在线算法。

算法1：解决联邦学习控制决策，保持边缘设备的原有的开关状态直到达到某些条件
算法2：由算法1调用。它以随机的方式将差异边缘状态转换为不可或缺的ON/OFF决策，而不会违反任何约束。
算法3：为算法1和算法2提供反馈。实时预测输入。仅基于现有的，可观察到的输入和以前的控制决策。

挖坑待续……

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Blanche117 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。