【论文阅读】Personalized Cross-Silo Federated Learning on Non-IID Data

最新推荐文章于 2024-04-18 19:28:44 发布

九九喵99

最新推荐文章于 2024-04-18 19:28:44 发布

阅读量1.8k

点赞数

分类专栏：论文阅读文章标签：机器学习深度学习神经网络

本文链接：https://blog.csdn.net/qq_40963226/article/details/120512472

版权

2 篇文章 0 订阅

订阅专栏

一、目的

这篇文章被AAAI2021接收。由于联邦学习存在数据non-iid分布，论文认为单一全局模型无法适合所有client，因此采用个性化联邦学习，为每个client提供个性化的模型。

在这里插入图片描述

可以看出 $\mathbf{u^k_i}$ 是 $\mathbf{w^{k-1}_1}, ..., \mathbf{w^{k-1}_m}$ 的线性组合，通俗的说，这样做使节点i集合了其他节点的权重信息。

根据注意传递函数 $A$ 的的定义，可知 $A^{'}$ 是非负非递增的，因此 $\|\mathbf{w^{k-1}_i}-\mathbf{w^{k-1}_j}\|^2$ 越小， $A'(\|\mathbf{w^{k-1}_i}-\mathbf{w^{k-1}_j}\|^2)$ 越大， $A^{'}$ 是一个相似度函数。这样，我们根据 $\mathbf{u^k_i}$ 的定义，可以看到，越相似的节点，对彼此的权重越高，影响越大。

由此形成了联邦训练过程中的正反馈，相似节点成对协作，加速收敛。

FedAMP的一种启发式方法，论文引用相关文献说明在维度很高的情况下，用欧几里得距离来测量两者的差异并不那么有效。

因此，HeurFedAMP重新定义了权重：
在这里插入图片描述

即，两者参数的余弦相似度更大，则权重更大，协作更多。

余弦相似度在评价高维模型参数间的相似度时比欧氏距离更具有鲁棒性。

这篇文章的思想和算法不难看懂，亮点在于用理论去得到算法，有很扎实的理论基础，很有说服力。

关注