联邦学习的根本目标是为了保障数据信息安全,但是在不同的场景,不同的主体对于隐私和数据安全的要求或者定义不相同。因此在联邦学习中,参与方们在进行隐私保护下的机器学习之前需要定义数据安全的概念,达成共识。
在联邦学习中,我们有以下4个假设:
1. 所有参与方们都是诚实但好奇的。所有的参与方们会遵循联邦学习的数据保密规则,但同时他们也会利用所得到的所有信息去推测其他参与方的数据信息。
2. 在参与方们之间存在潜在的恶意的一方,该参与方会通过控制或者篡改自己数据去影响联合建模的效果。
3. 零知识和一些知识的博弈。零知识是一种理想的状态,指的是在联合建模之后,参与方们对彼此的数据信息一无所知。但是零知识的现象伴随着高度复杂的系统和传输方式,在实际中并不可取。在数据安全的假设允许建模的参与方们知道对方部分的非关键信息,在一些知识假设下的联合建模可以达到更高的系统效率。
4. 联邦学习既存在中心也存在节点,安全定义需要防御恶意中心和恶意数据节点。
联邦学习的安全主要涉及三个方面:数据安全、隐私保护、传输安全。
数据安全
原始数据或能够推测出原始数据的数据,不应泄漏给其他参与方、协调方或用户。假设有K(k>1)方参与联邦学习建模。其中有一方怀有恶意,其试图从交互的中间结果推断其他参与方的训练数