联邦学习
关于联邦学习
“数据不动模型动”,这是联邦学习的核心,让模型在不同机构之间、端和云之间进行沟通交流。那它产生的效果是什么?
——“数据可用不可见”,这里所说的不可见,是别人看不见你的数据,你也看不见别人的数据,即数据和模型都保留在本地,建模的过程也保证了数据的安全。
定义
联邦学习(Federated Learning)实际上是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。它可以实现各个企业的自有数据不出本地,而是通过加密机制下的参数交换方式,即在不违反数据隐私法规的情况下,建立一个虚拟的共有模型。在这样一个机制下,参与各方的身份和地位相同,成功实现了“共同富裕”的目标。
过程
联邦学习的过程分为自治和联合两部分。
自治的部分:首先,两个或两个以上的的参与方们在各自终端安装初始化的模型,每个参与方拥有相同的模型,之后参与方们可以使用当地的数据训练模型。由于参与方们拥有不同的数据,最终终端所训练的模型也拥有不同的模型参数。
联合的部分:不同的模型参数将同时上传到云端,云端将完成模型参数的聚合与更新,并且将更新好的参数返回到参与方的终端,各个终端开始下一次的迭代。以上的程序会一直重复,直到整个训练过程的收敛。
特点
用户隐私数据的保护:联邦学习的根本目标和最大的优点