Fedproto:原型聚合的联邦学习框架

实验室里哈啤酒

已于 2023-07-28 20:44:49 修改

阅读量1.8k

点赞数 3

分类专栏：人工智能从入门到入土文章标签：论文阅读深度学习

于 2023-07-17 18:14:13 首次发布

本文链接：https://blog.csdn.net/weixin_47754029/article/details/131767958

版权

人工智能从入门到入土专栏收录该内容

8 篇文章

订阅专栏

FedProto是一种针对联邦学习中客户端异构性的新框架，通过使用原型代替梯度进行聚合。每个客户端维护并更新本地原型，以接近全局原型，从而提高模型的优化和泛化能力。这种方法受到原型学习的启发，旨在整合不同数据分布的特征表示，类似于人们交换概念原型以增强知识理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目：FedProto: Federated Prototype Learning across Heterogeneous Clients

网址：http://arxiv.org/abs/2105.00243

前言

文中说明，联邦学习通过计算传递梯度聚合模型时，客户端之间的异构性通常会阻碍模型优化收敛和泛化性能。故本文提出新的FedProto框架，将梯度替换成为原型，通过计算、聚合从不同客户端收集到的本地原型，然后将全局原型发送回所有客户端，以规范本地模型的训练。对每个客户机进行局部训练的目的是最小化对本地数据的分类损失，同时保持生成的本地原型足够接近相应的全局原型（损失函数最小+正则）。

什么是原型？

文中提到：“受原型学习的启发，在异构数据集上合并原型可以有效地整合来自不同数据分布的特征表示，例如，当我们谈到“狗”时，不同的人会有一个独特的“想象图片”或“原型”来代表“狗”的概念。由于不同的生活体验和视觉记忆，他们的原型可能会略有不同。在人之间交换这些概念特定的原型，使他们能够获得更多关于“狗”概念的知识。将每个FL客户端视为一个类人的智能代理，我们的方法的核心思想是交换原型，而不是共享模型参数或原始数据，这可以自然地匹配人类的知识获取行为。”

Fedproto框架

fedproto settings

在理解FedProto架构之前，需要理解一些settings：

对于异质数据集联邦学习，其服务器端需要识别全体数据集的样本类别C，C={c1,c2,...,cn}，对于客户端而言，只需识别构成C子集的少数几个。

深度学习模型被分为两部分：

1、表示层：通过将样本嵌入到embedding function中将输入的实例x从原始特征空间转换到嵌入空间。第i个客户端的嵌入函数为fi( φi )，由φi参数化。记hi = fi( φi ; x)为x的嵌入。

2、决策层：分类。给定一个监督学习任务，可以通过νi参数化的函数gi( νi )生成对输入样本x的预测。Fi( φi , νi) = gi( νi )。fi ( φi )，我们用ωi表示( φi , νi)【注意这儿的gi( νi )。fi ( φi )，意思是gi( νi )是fi ( φi )的外函数，通过它对嵌入向量进行决策。】

原型：定义一个原型C ( j )来表示C中的第j类。对于第i个客户端，原型是第j类中实例的嵌入向量embedding vector的均值。