Communication-Efficient Learning of Deep Networks form Decentralized Data

最新推荐文章于 2024-04-27 08:33:11 发布

秋宝1028

最新推荐文章于 2024-04-27 08:33:11 发布

阅读量3.8k

点赞数 14

分类专栏：联邦学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_62646577/article/details/126587102

版权

联邦学习专栏收录该内容

12 篇文章 8 订阅

订阅专栏

引入：

传统数据训练方式，用户将本地数据提交给可信云服务器进行统一集中并训练：①如何保证用户本地数据的隐私性？
②如何保证计算成本和通信开销？

联邦学习的提出，可以较好地解决上述问题。

背景介绍：

分布式训练方法，把资料留在本地端，打造出可部署至上百万支手机的输入字推荐模型。
①个别用户从中央主机下载一套模型，接着在数以万计的用户端，根据用户端的使用行为，来训练Local端模型。

②训练好后，用户手机会上传模型权重（也称参数）至中央主机，中央主机收集一定数量的权重后，就会聚合，计算出一个优化过的权重，再回放到用户端手机，进行下一轮训练。

③这个过程会不断重复，直到模型达到理想的表现。在这过程中，只会上传模型参数，完全不会上传用户资料。

主要贡献：

①引入FederatedAveraging算法，将每个客户端的局部随机梯度下降（SGD）与执行模型平均的服务器相结合
②针对非独立同分布数据集和通信问题进行解决

非独立同分布数据集：

通信问题：
（1）并行化，采用更多的用户参与训练优化
（2）增加每个用户的计算开销，减少通信轮数

联邦平均：（FedAVG算法）

FedAvg算法的计算开销与三个参数相关:
1、C:每轮通信内，执行计算的用户所占的比例（0≤C≤1）
   C=1表示所有用户均参与联邦优化，
   C*K表示参与用户数量，
   C=0表示有且仅有1个用户均参与联邦优化
2、E:每轮通信内，每个用户对其本地数据集进行的训练迭代次数(E≥1)
3、B:用户更新训练本地数据集的小批量大小(B≥1)意思为每次训练给多大的数据