论文笔记——Federated learning framework for mobile edge computing networks
本论文着重研究的是联邦学习应用于需求预测类问题。
一般来说,FL存在的一些问题:
- 非独立同分布数据。客户训练数据集各不相同,给定的本地训练数据集不代表人口分布。
- 不平衡数据集。每个客户的本地训练数据量不同。这意味着不同客户对训练价值观的可靠性不同,因为训练程序可能太短。
- 大规模分销。FL框架中涉及的客户端明显大于本地处理的数据数。
- 有限的沟通。移动设备并不总是可用于训练数据,而且通常它们可能速度慢或通信条件差。
本论文提出了一种混合云MEC网络方案,考虑了位于网络边缘ED、考进边缘设备的网络元素NE上部署大多数请求应用程序的虚拟机副本VRC。
以命中率AHP来进行适当的VRC分配,AHP表示查找设备在其附近的NE上请求组的应用程序时的命中率。
本研究的主要贡献是
- 将FL架构的情境化应用于VRCs的部署问题,利用分散的训练数据是在VRCs的分配问题上寻求有效结果的有力工具
- 在不耗尽EDs硬件资源的情况下,检测和应用执行分散数据训练的基本方法。
- 行了大量的数值模拟,并与混沌理论(CT)方法进行了比较,验证了将该方法应用于VRCs展开问题所产生的显著性能。
网络结构:
每个需要任务计算的ED主要在一个附近的NEs上查找一个所需应用程序的VRC。(我们假设每个ED将任务发送到最近的NE,如果它不包含ED请求的应用程序,则将任务转发到包含该应用程序的最近的NE。最后,我们假设每个NE都知道其他NE包含的VRCs,并且每个NE都存储了一个路由表,其中为每对NEs保存了这些NEs之间的最短路径。)如果没有一个NE拥有所需应用程序的VRC,任务被发送到所有应用程序类型都存在的云。
ED j在执行计算时所经历的总计算成本(OCC)由
给出,
其中 和 分别表示任务j在NE i和云上花费的时间。需要注意的是, 和 ,都表示为在NE和云的CPU中花费的任务执行时间的总和,以及任务在这些站点上等待执行所经历的排队时间。(假定CPU队列采用先进先出的服务策略)此外, 表示将任务从ED j发送到其最近的NE i*时的传输成本。如果任务j是在NEi上计算的,则 的二进制值为1,否则为0。
算法:
提出的FL框架由负责本地数据训练的客户端和服务器端(通常为基站)组成,所述基站由旨在通过合并和聚合EDs更新的本地模型来改进全局学习模型的中央服务器表示。该方法基于客户端和服务器端的交互过程,在每轮算法迭代过程中,训练过程中涉及的EDs是整个EDs集的子集,其元素数等于y。
实验采用的数据集为MovieLens 1M数据集,以下称为数据集1,以及MovieLens 100K数据集[34]在这篇论文中称作数据集2。
为了验证所提出方法的有效性,比较了用CT方法、通过相空间重构方法和提出的基于深度学习的方法获得的预测值的准确性。
原文见论文题目