联邦学习-技术层面问题

最新推荐文章于 2024-08-22 22:48:39 发布

sean xiao。

最新推荐文章于 2024-08-22 22:48:39 发布

阅读量828

点赞数

文章标签：人工智能网络安全机器学习

本文链接：https://blog.csdn.net/qq_50492291/article/details/124878988

版权

想重新理解联邦学习，将联邦学习的原理和技术层面的理论都详细了解一遍。

联邦学习是这几年机器学习的一个热点，实质上联邦学习实际上是一种特殊的分布式学习。

联邦学习产生的原因就是：运营商是需要用户数据去进行大数据分析等工作的，但是当用户不想自己的数据传到云端，那么运营商怎么获得用户不允许上传云端的数据呢？（在国外，针对用户隐私的法律又非常严苛），故产生了联邦学习（federate learning的英文也可以去理解联邦学习的表意）。

虽然联邦学习十四分布式的机器学习，但是相比之下，还是有差别的，不然也不会重新起一个名字。具体有以下几点差别：

用户对自己的设备和数据有绝对的控制权。可以决定自己的数据是否参与联邦和通信，（这就和名字里的邦对应，每个邦都有完全的自治权，不受中央的控制），这里和原有的分布式机器学习就有很大的区别，
联邦学习的worker节点是非常不稳定的，或许用户到了没网的地方就没有信号了，这也对分布式计算造成了困难。
通信代价大，传统的分布学习大都是拿网线连起来的或者有高速宽带，但是联邦学习都是手机，ipad的，设备和服务器是远程连接。带宽低，网络延迟高，因此要是想获得一个模型参数，不可能很快完成，能几秒完成就是高效的了。
联邦学习数据不是独立，同分布。理解：就是每个worker节点设备的的数据是很不相同的，比如女生喜欢自拍，男生不喜欢，这样会造成手机这类设备的相册数据差别很大。

因此，减少通讯次数的算法不再适用。

Worker节点负载不平衡。理解：有的用户拍的照片多，有的用户，照片拍的少，这样数据集相差很大，如果节点数据集有的大，有的小，这样建模和计算会出问题。如果建模时给每张图片相同的权重，那么学出来的模型就取决于拍了很多张的用户，忽略了拍照少的用户。如果每个用户相同的权重，也是不合适的，有的用户用手机时间长，有的用手机时间段，这样建模也是不公平的。

因为数据大小不一样，也导致计算时间不一样，传统的分布式学习可以进行负载均衡，但是联邦学习不能负载均衡

总而言之就是：虽然联邦学习是分布式学习，但与分布式学习相比，又有很多的技术难点。

针对2，3 ，我们需要减少通讯次数，本来100次达到收敛，现在争取20次达到收敛。所以我们的研究重点就是减少通讯次数。