【论文阅读】Adapt to Adaptation: Learning Personalization for Cross-Silo Federated Learning（APPLE）

噜噜噜鹿鹿

于 2024-09-26 15:35:29 发布

阅读量218

点赞数 3

分类专栏：联邦学习文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52330760/article/details/142556755

版权

联邦学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

论文提出的方法叫做APPLE

1. 论文大意

论文首先就是指出现有的PFL方法（比如finetune和个性化层）都没怎么捕捉到不同task之间的联系，所以就提出了这个方法，为每一个Client引入了一个长度为n的权重变量 $p_i$ ,也就是i号客户端对于当前客户端的权重，初始化为1/n。

那怎么知道权重变量到底应该要等于多少？是通过train出来的，于是又引入了一个叫做“核心模型”的名词，当然事后就知道核心模型其实就是每个客户端各自的模型。具体来说就是每个客户端都能获取到其他所有的客户端的模型，然后拿着其他客户端的模型跑自己的数据，谁跑出来的loss小谁就对我有帮助，权重会相对大一些。

当然作者又发现实际情况把所有的客户端的模型都拿过来太耗费资源了，又设置了一个数量上界M。每次只拿M个，没拿满的时候优先拿之前没拿过的客户端的模型。

$F_i(w_i^{(p)}) = \frac{1}{n_i} \sum_{\xi \in D_i^{tr}} \mathcal{L}(w_i^{(p)}; \xi) + \lambda(r)\frac{\mu}{2} \| p_i - p_0 \|_2^2$

以上是训练p的损失函数。λ是权重函数，随着轮次的上升而下降。
正则化项的作用是在优化过程中引导 $p_i$ 不要偏离全局初始向量 $p_0$ 太多：

早期阶段：正则化项的权重较大，DR向量 $p_i$ 的更新受到更多限制，倾向于让客户端更多地依赖全局模型。
后期阶段：随着训练轮次的增加，正则化权重逐渐减小，允许客户端的个性化模型逐渐发挥更大的作用。

通过这个动态调整机制， $p_{i,j}$ 会根据客户端的需求逐渐优化出一个最优组合，使得客户端 $i$ 在本地数据上的性能最优。

2.算法缺陷

很明显的缺陷是

数据传输成本过大（每次一个客户端要拿M个模型，N个客户端就是N*M个）
训练时间成本过大（不仅要拿M个模型，还要拿这M个模型trainM次才能跑出来权重。。。）

最后可能这个算法才刚刚开始没跑几轮，其他的算法都已经跑完+finetune完了。。。

噜噜噜鹿鹿

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。