干货！联邦学习中的合作均衡

AITIME论道

于 2022-07-28 08:30:07 发布

阅读量859

点赞数

文章标签：算法人工智能大数据编程语言 python

本文链接：https://blog.csdn.net/AITIME_HY/article/details/126047235

版权

联邦学习在保护数据隐私的同时实现多数据源模型训练。统计异质性可能导致合作模型性能下降，为此，提出了合作均衡理论，确保机构仅与互利的伙伴合作，最大化自身模型性能。合作均衡存在性得到证明，并提出基于帕累托优化的合作策略，以O(V+E)时间复杂度找到合作均衡。报告深入探讨了联邦学习的合作原则、理论结果和实际应用案例。

摘要由CSDN通过智能技术生成

点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入！

联邦学习（federated learning）是指在保护数据隐私的前提下实现分布式多数据源模型训练的学习范式。由于各个数据源的统计异质性在现实场景下广泛存在，同时统计异质性也给联邦学习下合作式的模型学习带来了负面影响，甚至会损害模型性能。

这也带来了一个基本问题：一个机构（client）加入合作网络能否获得增益，即参与合作是否意味着自身模型性能的提升。事实上，一个机构并非总是与所有机构合作才能带来自身性能的最大化。我们建立了联邦学习下的合作均衡理论，其中各个机构只与对其有利的机构合作，最大程度上避免负迁移的影响，从而实现自身模型性能的最大化。

具体来说，我们提出以下两个公理刻画合作均衡：1. 自私原则；没有利益，就没有合作；2. 理性原则；各个机构致力于最大化自身模型性能。我们提出了增益图（benefit graph）的概念，描述了每个机构的最优合作者，并提出了一种基于帕累托优化的方法确定最优合作者。

我们在理论上证明了合作均衡的存在性，并提出了一种基于图论的方法，实现O(V+E)时间复杂度的合作均衡。

本期AI TIME PhD直播间，我们邀请到清华大学信息学院博士生—崔森，为我们带来报告分享《联邦学习中的合作均衡》。

崔森：

清华大学信息学院博士三年级，师从清华大学张长水教授。主要研究方向为可信赖机器学习，包括算法公平性，鲁棒性，可解释性，和隐私保护等。以第一作者身份在SIGKDD，NeurIPS等机器学习会议上发表多篇论文，担任ICML，NeurIPS等机器学习会议审稿人，个人主页https://cuis15.github.io/。

今天分享的内容包括以下几个要点：首先是对联邦学习的一个简单介绍，其次是联邦学习中的统计异质性问题，之后是合作均衡相关的符号，定义，和理论结果。

A Brief Introduction of Federated Learning

我们简单介绍一下联邦学习，首先联邦学习指的是一个学习范式，多个client联合学习一个globel的或者是personalized模型，同时不直接接触其他client的数据。

联邦学习通常可能应用于一些隐私高敏感场景，例如医院，医院中的数据涉及到病人隐私，银行，银行数据关系到客户的金融隐私，以及我们的手机数据。

联邦学习的目的是（1）保护局部client的数据隐私（2）利用所有client中的数据碎片，提升每一个client的模型的性能

我们在上图中举了一个例子，图中有N个clients，其中每个client有自己的数据D_i, 包括输入空间X和输出空间Y，学习任务就是给定X预测Y。M_i代表client i上的模型，通过server实现client之间模型的交互，从而利用了其他client的信息。

一个很自然的问题就是为什么不直接用local的数据直接拟合一个模型，而是要用联邦的方式联合学习模型呢？事实上，local client的数据往往严重不足，模型学习可能会面临过拟合，所以它需要来自外部的其他client的数据。

Statistical Heterogeneity and Performance Inconsistency

刚刚我们说到，联邦学习中每个client有自己的学习任务和自己的数据集，比如输入X预测Y，然而，不同的client的数据可能不是独立同分布的，这就是联邦学习中的统计异质性问题，这就给合作式的模型学习带来了额外的困难，其中有一个现象就是，各个client的性能的严重不一致。

最低0.47元/天解锁文章

AITIME论道

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
干货！联邦学习中的合作均衡

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入！联邦学习（federated learning）是指在保护数据隐私的前提下实现分布式多数据源模型训练的学习范式。由于各个数据源的统计异质性在现实场景下广泛存在，同时统计异质性也给联邦学习下合作式的模型学习带来了负面影响，甚至会损害模型性能。这也带来了一个基本问题：一个机构（client）加入合作网络能否获得增益，即...
复制链接

扫一扫