目前联邦学习面临的主要挑战
- 安全:安全方面的挑战通常是由于缺乏对数据的访问控制以及来自恶意节点的恶意攻击。对联邦学习最常见的攻击之一是投毒攻击,如果有毒数据集很庞大的话,那么像虚假标签攻击和后门攻击可能会导致严重的损害。
- 隐私:联邦学习通过提供本地模型参数信息而不是客户的本地原始数据来保护隐私。然而,在训练过程中简单地保持数据本地化并不能提供足够的隐私保证,分析梯度信息仍然可以为第三方或中央服务器提供私人信息。例如,可以通过获取梯度信息来恢复客户端的原始图像。此外,模型本身也可以用来实现反转和推理攻击。
- 通信成本:在联邦学习系统中,网络中可能涉及到数百万个设备,而且每个设备在本地训练模型上花费的时间可能远远少于它们的网络通信。由于本地模型需要定期上传到服务器,因此当有大量参与者时,通信成本会变得更加沉重。由于无线网络的带宽有限,这个问题可能成为一个瓶颈。此外,在连接速度不对称时,如何减少上行通信也是一个重要的问题。
- 异质性:由于设备的网络状态、存储和处理能力的多样性,相应的计算和通信的能力将会有所不同。这种异构性加剧了延迟缓解和容错 。此外,由于数据的生成方式和收集方法的不同,数据本身也是异构的。例如,来自不同客户端的数据可能很容易就变得异构,非独立同分布的数据将更难处理,这增加了建模和评估的复杂度。