Desirable Companion for Vertical Federated Learning: New Zeroth-Order Gradient Based Algorithm
背景
解决的问题:现有的VFL算法不能同时很好地满足模型适用性、隐私安全、通信耗费、高效计算这四点要求。大多数现有的VFL框架使用基于梯度的更新策略,很难适用于难以获得甚至无法获得梯度的ML问题。
本文将零阶优化与VFL相结合,提出了基于零阶优化的VFL框架,其中设计了一个适用于VFL的异步零阶算法AsyREVEL,并进行了收敛性证明。该框架可以抵抗现有的不同等级的VFL攻击,同时具有良好的性能。
背景知识
零阶优化(ZOO,Zeroed Order Optimistion)
零阶优化是一种无梯度优化,适用于梯度难以获得、黑盒学习等场景。它只使用函数值而不是显式的梯度值来进行优化。
原理是模仿一阶方法,使用函数值的有限差分来估计梯度。优点:易于操作、收敛保证、函数查询效率。
- One-point gradient estimate
![image-20221006104536099](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529547.png)
其中随机方向ui是iid的,服从特定分布,并且µ > 0是一个小的步长,称为平滑参数。
方法
框架
![image-20221006101249107](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529210.png)
模型为黑盒模型,worker与服务器之间只传输函数值,即前向传播中神经网络的输出值以及损失函数的输出值。
安全性分析:现有的VFL攻击都需要获得信息,如模型参数或(中间)梯度,由于ZOO-VFL只传输黑盒信息(如函数值),所以可以抵抗现存的VFL攻击并保护隐私安全。
1. VFL形式
有q个参与者和一个服务器,服务器持有标签,所有参与者和服务器想要联合起来解决一个有限和问题:
![image-20221006104613715](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529548.png)
其中,fi是第i个样本的损失函数,F0服务器持有的全局模型,第m个参与者的本地模型Fm映射输入 xi,m 到输出 ci,m , g是正则化函数。
2. AsyREVEL算法
注意:不是利用链式法则计算,而是直接零阶估计
,因为如果先分别零阶估计
和
然后再相乘的话,两个零阶估计的梯度相乘会带来额外的方差。
本文分别将零阶估计方法应用到每个模型上。提出对第i个样本损失函数关于w的梯度的计算公式:
![image-20221006105313616](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529553.png)
其中, 代表函数
中只有wm 是变量,其他参数固定。
和
的计算方法如下,其中
是Fm的一个估计的输出:
![image-20221006110609675](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529559.png)
对于w0的梯度计算公式如下,也是一个估计值:
![image-20221006110736555](https://masterchef-1301213131.cos.ap-nanjing.myqcloud.com/markdown/202210131529561.png)
算法流程
当等式(4)和(6)中的u的分布为零均值各向同性多元高斯分布时,该算法称为AsyREVEL-Gau
当u的分布为单位球面上的均匀分布时,称为AsyREVEL-Uni
创新点
首次将ZOO与VFL结合,提高了VFL的框架适用性,并能有效抵御三种层次的威胁模型下的攻击。
提出了结合ZOO的VFL框架,并在此框架下提出了AsyREVEL算法