【论文导读】- Cluster-driven Graph Federated Learning over Multiple Domains（聚类驱动的图联邦学习）

最新推荐文章于 2024-10-17 15:34:15 发布

kenzsoft

最新推荐文章于 2024-10-17 15:34:15 发布

阅读量752

点赞数 26

分类专栏：程序员文章标签：大数据面试学习

本文链接：https://blog.csdn.net/kenzsoft/article/details/138692373

版权

程序员专栏收录该内容

111 篇文章 0 订阅

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

论文信息

Cluster-driven Graph Federated Learning over Multiple Domains
在这里插入图片描述

原文链接：Cluster-driven Graph Federated Learning over Multiple Domains：https://openaccess.thecvf.com/content/CVPR2021W/LLID/papers/Caldarola_Cluster-Driven_Graph_Federated_Learning_Over_Multiple_Domains_CVPRW_2021_paper.pdf

摘要

Federated Learning (FL) deals with learning a central model (i.e. the server) in privacy-constrained scenarios, where data are stored on multiple devices (i.e. the clients). The central model has no direct access to the data, but only to the updates of the parameters computed locally by each client. This raises a problem, known as statistical heterogeneity, because the clients may have different data distributions (i.e. domains). This is only partly alleviated by clustering the clients. Clustering may reduce heterogeneity by identifying the domains, but it deprives each cluster model of the data and supervision of others. Here we propose a novel Cluster-driven Graph Federated Learning (FedCG). In FedCG, clustering serves to address statistical heterogeneity, while Graph Convolutional Networks (GCNs) enable sharing knowledge across them. FedCG: i) identifies the domains via an FL-compliant clustering and instantiates domain-specific modules (residual branches) for each domain; ii) connects the domain-specific modules through a GCN at training to learn the interactions among domains and share knowledge; and iii) learns to cluster unsupervised via teacher-student classifier-training iterations and to address novel unseen test domains via their domain soft-assignment scores. Thanks to the unique interplay of GCN over clusters, FedCG achieves the state-of-the-art on multiple FL benchmarks.

联邦学习( Federation Learning，FL )是在隐私受限的场景中学习一个中心模型(即服务器)，其中数据存储在多个设备(即客户)上。中心模型不直接获取数据，只对每个客户端本地计算的参数进行更新。这就产生了一个问题，称为统计异质，因为客户可能具有不同的数据分布(即域)。聚类可以通过识别领域来降低异构性，但是它剥夺了每个集群模型的数据和其他人的监督。

本文提出了一种新的聚类驱动的图联合学习( Fed CG )。在FedCG中，聚类服务于解决统计异构性，而图卷积网络( Graph Convolutional Networks，GCNs )则实现了跨网络的知识共享。
FedCG：i ）通过符合FL的聚类来识别域，并为每个域实例化域特定的模块(残差分支)；ii) 在训练中通过GCN连接特定于域的模块，以学习域之间的交互并共享知识；iii ) 学习通过teacher-student 分类器-训练迭代进行无监督聚类，并通过其域软分配分数来处理新的看不见的测试域。

得益于GCN在聚类上的独特交互，FedCG在多个FL基准上达到了最先进的水平。

主要贡献

提出了第一个基于聚类驱动的GCN方法来解决FL场景中的统计异质性问题。得益于通过GCN学习到的域之间的交互，知识根据基于相似性的准则在域之间共享，降低了过拟合的风险，并帮助填充较少的域。
引入了一个为联邦学习场景设计的迭代师生聚类算法，它允许通过软分配适应新的领域。这样可以在不违反FL约束的情况下捕获不同的域分布。每个领域分配模型特定的组件，通过GCN交互进行训练。
我们在多个FL基准上评估了我们的模型，在这些基准上，我们与最先进的模型进行了比较。

聚类驱动的图联邦学习

问题定义

我们的目标是学习一个函数f θ：X —> Y，以θ为参数，将输入空间X中的样本映射到输出空间Y中对应的语义。具体来说，我们关注一个分类任务，其中X包含图像，而Y是定义在一组标签上的概率。

在FL设置中，服务器没有直接访问数据的权限，但是可以与一组客户端C进行通信，其中每个客户端c∈C访问一个本地数据集 Tc = { xi，yi } nci = 1 ，其中x∈X，y∈Y。

在此情景下，可以通过查询客户端并依靠其本地更新的参数θ来学习f θ。特别地，由于| C |很大，我们可以假设在通信轮中执行同步更新方案，其中在每一轮中，一组K客户端接收f θ，其中| K |远小于| C |。每个客户端通过最小化给定的目标函数，用其本地数据集计算θ的局部更新，即θ k。由于我们考虑分类任务，我们通过最小化标准交叉熵损失来更新θ k：
在这里插入图片描述