[联邦学习]FedProx算法&&工作原理&&步骤

唐火

已于 2024-05-28 21:51:38 修改

阅读量3k

点赞数 28

分类专栏：联邦学习文章标签：算法人工智能联邦学习分布式

于 2024-05-27 18:00:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51955470/article/details/139240803

版权

[联邦学习]FedProx

FedProx（Federalized Proximal Algorithm）是一种在联邦学习（Federated Learning, FL）环境下设计的优化算法，旨在处理数据在不同客户端之间可能存在的不均匀分布（Non-IID Data）的问题。联邦学习是一种机器学习设置，允许多个客户端协作训练一个共享的模型，同时保持数据的隐私和安全，因为数据不需要集中存储或处理。

FedProx是Li Tian等人于2018年(论文链接)所提出的一种针对系统异构性鲁棒的联邦优化算法，发表于MLSys 2020上。它相较于FedAvg主要做出了两点改进：

采样阶段使用了按数据集大小比例，可放回采样，并直接平均聚合（无加权）来获得无偏梯度估计
本地训练阶段基于近端项优化的思路，魔改了本地训练的目标函数为

$\frac{\mu}{2}||w^t_{k,i} - w_{global}||^2$

"采样"指的是服务器从参与方（客户端）的数据集中选择样本进行模型更新。因此，在FedProx中，采样是服务器在每轮迭代中从参与方的数据集中按照每个参与方数据集大小的比例进行选择的过程。具体来说，如果某个参与方的数据集更大，则它在采样中被选中的概率更高。

因此，这里的"采样"是指服务器在联邦学习中选择参与方的过程，而不是指参与方选择自己的数据的过程。

背景和问题

在标准的联邦学习模型中，如FedAvg（Federated Averaging），每个客户端独立地在本地数据上训练模型，然后将更新的模型发送给中央服务器。服务器将这些更新平均合并，以更新全局模型。然而，当不同客户端的数据分布差异很大时（即Non-IID），这种简单的平均可能导致模型性能下降，因为它没有考虑到各客户端更新的差异性。

FedProx的工作原理

FedProx在FedAvg的基础上增加了一个正则化项，这个正则化项惩罚模型参数与全局模型参数之间的偏差。具体来说，FedProx的目标是最小化以下目标函数：

$\sum_{k=1}^K \frac{n_k}{n} \left( F_k(w) + \frac{\mu}{2} |w - w^t|^2 \right)$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。