2_文献阅读_Federated Learning for 5G Base Station Traffic Forecasting

最新推荐文章于 2024-08-09 18:24:08 发布

郭小儒

最新推荐文章于 2024-08-09 18:24:08 发布

阅读量881

点赞数 28

分类专栏： # 流量预测文献阅读文章标签： 5G 深度学习 python

本文链接：https://blog.csdn.net/qq_43403653/article/details/134540180

版权

流量预测文献阅读专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文探讨了如何运用FederatedLearning在5G基站中进行流量预测，包括问题建模、联邦训练过程中的挑战（如非独立同分布数据和异构数据），以及联邦聚合策略（如FedAvg、FedProx和FedNova）。

摘要由CSDN通过智能技术生成

Federated Learning for 5G Base Station Traffic Forecasting

- 3. 方法

3. 方法

3.1. 问题建模

individual learning： 一个基站对于观测结果进行局部训练
- $d$ 是变量个数：down（下行流量）,up（上行流量）,rnti_count（基站连接的用户数）,mcs_down（下行调制和编码的方案编号）,mcs_down_var（下行编码的方案的方差）,mcs_up,mcs_up_var,rb_down（下行链路分配资源块数量）,rb_down_var,rb_up,rb_up_var
- $X_t=\{x_{\{t,1\}},…,x_{\{t,d\}}\}$ ： 表示t时间的观测值
  174876888.0,1856888.0,10229,15.332298145449199,87.15768837702974,14.981496960486323,49.989484126984124,0.029681166666666665,4.4976976147873475e-08,0.0005406666666666667,3.143297486772487e-08
- 时间窗： $T\in[t-T+1,t]$
- 滞后数据： $X_t^*=\{X_{t-T+1},...,X_t\}$
- 目标：
  - 通过过去的 $T$ 个时间步的数据 $X_t^*$ 预测下一个时间步的数据 $\hat y_{t+1}$
  - 通过整个的数据集 $D_{ind}=\bigcup_{i \in m}X_{\{t,i\}}^*$ , $m$ 表示数据集中有时间窗的个数
  - 目标是创建一个可以对不可见的未来序列进行泛化的模型
centralized learning： 将基站的所有数据组合起来传输到“第三方（云）”中，然后进行训练
- combined data： $D_{cen}=\bigcup_{i \in n}D_{ind}^i$
- 目标：构建一个模型，至少对于 $n$ 个基站来说，这个模型可以被泛化来预测不可知的未来序列
federated learning： 所有 $n$ 个基站合作建立一个预测模型，这个模型可以推广到预测未来序列
- 每个参与者（基站） $\in n$ 持有自己的时间序列数据，然后再有限的 $e p oc h$ 中训练一个局部的模型
- 参与者将自己训练的本地学习模型的参数传输给 $a gg re g a t or$ （聚合器），生成一个平均模型
  - 这个过程一直持续
  - 直到全局模型聚合了所有 $n$ 个观测者的局部模型

3.2 联邦流量预测设计

3.2.2 联邦训练

Client： 基站
Server： 服务器
Client从Sercer中采样，获得当前的global model
Client使用自己的数据执行本地训练
本地训练之后，Client将更新的local models和historical metrics（损失矩阵和评估矩阵）返回调Server中
Server聚合收集到的local model，更新global model并且这个过程重复多个federated rounds
联邦训练完之后，Server将最终的global model传输给Clients
可以设计联邦学习可以使用不同的时间间隔进行动态执行，提高预测精度
Clients可以进行局部微调local model来使模型更加接近他们的本地数据，提高预测精度

3.2.3 联邦聚合 $F e d er a t e d A gg re g a t i o n$

联邦学习中最重要的就是model aggregation
- central server从clients收集和聚合模型，来更新global model的状态
- 困难：处理non-iid（不是独立同分布的）数据和异构数据（不统计站的数据）
FedAvg：
- 聚合是通过计算client模型的加权平均值，基于数据量
- 这种方法让有更多数据量的基站（Client）有更大的影响力
- 存在问题： global model收敛到一个和目标函数不一样的平稳点，这可能与真正的全局目标有很大的不同
- 解决方案：处理数据的异构性：FedProx
FedProx：
- FedProx是FedAvg的一般化，提供了鲁棒的收敛性
- 引入 $\mu$ 来控制局部目标，限制了以前的（ $p re v i o u s$ ）模型权重和现在的（ $c u rre n t$ ）模型权重的距离
FedNova：
- 在平均过程中对局部模型更新进行归一化
- 对标准化的局部梯度求平均值
  - 标准化的局部梯度 $\div$ 局部训练的步骤数
  - 不是在没有任何标准化步骤的情况下求累积的局部梯度的平均值
FedAvgM：
- 在每个epoch中
  - 将之前的模型更新值乘上 $\beta$
  - 增加新的更新值
FedAdagrad, FedYogi and FedAdam：
- 效率依赖于超参数 $(\lambda,\beta_1,\beta_2)$

郭小儒

关注

28
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
2_文献阅读_Federated Learning for 5G Base Station Traffic Forecasting

FederatedAggregationdXtxt1xtd}T∈t−T1t]Xt∗Xt−T1...Xt}TXt∗yt1Dind⋃i∈mXti∗mDcen⋃i∈nDindinnp∈nepochaggregatornFederatedAggregationμpre。
复制链接

扫一扫