联邦学习笔记 Federated Learning

最新推荐文章于 2024-04-20 22:41:29 发布

努力搬砖的星期五

最新推荐文章于 2024-04-20 22:41:29 发布

阅读量2.6k

点赞数

分类专栏：笔记联邦学习机器学习

本文链接：https://blog.csdn.net/qq_33804792/article/details/117392535

版权

联邦学习最早在 2016 年由谷歌提出，原本用于解决安卓手机终端用户在本地更新模型的问题；本质上是一种分布式机器学习技术，或机器学习框架。

联邦学习是多个参与方在保护数据隐私、满足合法合规要求的前提下继续进行机器学习，解决数据孤岛的问题。

各方数据都保留在本地，不泄露隐私也不违反法规；
多个参与者联合数据建立虚拟的共同模型，并且共同获益的体系；
在联邦学习的体系下，各个参与者的身份和地位平等；
联邦学习的建模效果和将整个数据集放在一处建模的效果相同，或相差不大（在各个数据的用户对齐（user alignment）或特征（feature alignment）对齐的条件下）；
迁移学习是在用户或特征不对齐的情况下，也可以在数据间通过交换加密参数达到知识迁移的效果。

在这里插入图片描述

加密样本对齐。由于两家企业的用户群体并非完全重合，系统利用基于加密的用户样本对齐技术，在 A 和 B 不公开各自数据的前提下确认双方的共有用户，并且不暴露不互相重叠的用户，以便联合这些用户的特征进行建模。
加密模型训练。在确定共有用户群体后，就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性，需要借助第三方协作者 C 进行加密训练。
1. 协作者 C 把公钥分发给 A 和 B，用以对训练过程中需要交换的数据进行加密。
2. A 和 B 之间以加密形式交互用于计算梯度的中间结果。
3. A 和 B 分别基于加密的梯度值进行计算，同时 B 根据其标签数据计算损失，并把结果汇总给 C。C 通过汇总结果计算总梯度值并将其解密。
4. C 将解密后的梯度分别回传给 A

关注