【论文阅读】Towards Fair Graph Federated Learning via Incentive Mechanisms

BlueberrymanOnTheWay

于 2024-09-11 16:44:11 发布

阅读量397

点赞数 5

文章标签：论文阅读人工智能

本文链接：https://blog.csdn.net/blueberryman/article/details/142144037

版权

通过激励机制实现公平的图联邦学习

综述

待解决的问题：参与联邦学习的代理（agents）通常是自私的，如果没有公平且满意的激励机制，它们可能不愿意分享数据
- 背景：多个代理（agent）希望在保护数据隐私的前提下，共同训练一个图神经网络模型，以获得更好的模型性能
- 过程：每个参与者都有自己的图数据，它们在本地的模型进行训练，并将模型更新传回服务器，服务器整合这些更新，更新全局模型，并将新模型传回每个参与者
识别了一个特殊的现象：
- 有些代理可能会对联邦学习过程造成伤害
- 在贡献上有延迟
- 以前假设所有代理都积极的，及时的进行贡献——这篇文献发现了与这个假设相反的现象
创新点：
- 提出了一种针对图联邦学习的激励机制，综合了模型梯度和回报（payoff）的分配
- 引入“模体原型”的概念，用于在服务器和代理之间进行信息交换，可以帮助代理优化本地模型，在提高全局模型质量的同时，实现代理之间的公平性

1. 引言

一个理想的图联邦激励机制应该同时满足两个条件：
- 奖励拥有贡献的代理，惩罚造成伤害的代理
- 对贡献具有延迟的代理提供事后（post-hoc）补偿
推进了一个先进的激励机制
引入一个代理估值函数：
- 为了解决：选择一个能被所有代理访问并且接受的测试集是一个挑战
- 两个标准：梯度对齐和图多样性
引入新概念——motif protocols模体原型

2. 预备知识

传统图联邦学习（Vanilla Graph Federated Learning）

图联邦学习的场景设定：
- 考虑有 $N$ 个诚实代理者，每个代理 $i$ 有一个本地的图数据集 $D_i$ ，该数据集包含一组图。
- 目标：跨所有参与者学习一个共享的全局模型，通常是一个图神经网络，学习过程可以化为一个优化问题 $\underset{\omega_1,\omega_2,...,\omega_N}{min}\sum^{N}_{i=1}\frac{\vert D_i\vert}{\vert D\vert}L(\omega_i;D_i)$ 其中， $\omega_i$ 是代理 $i$ 的模型参数， $L(\omega_i;D_i)$ 是代理 $i$ 在其本地数据集 $D_i$ 上的训练损失， $D_i\vert$ 是代理 $i$ 的数据集大小， $\vert D\vert$ 是所有代理数据集的总大小
联邦学习的两个步骤：聚合和分发

Shapley值

用于单个玩家在不同合作联盟中对整体绩效的边际贡献
这个值回答了“在一个团队里面，每个参与者到底做了多少贡献？”
$\phi_i=\frac{1}{N!}\sum_{\pi\in \Pi_N}[v(S_{\pi,i}\cup \{i\})-v(S_{\pi,i})]$ 其中， $\Pi_N$ 是所有可能的玩家排列的集合， $S_{\pi,i}$ 表示在排列 $\pi$ 中在玩家 $i$ 之前的玩家组成的联盟， $v (S)$ 是联盟 $S$ 的价值函数

3. Methodology

定义每个代理的价值为 $r_i^t$ ，表示代理 $i$ 在第 $t$ 次的交流轮次中作出的贡献

3.1 Overview Framework

模型梯度分配：
- 采用了一种稀疏梯度方法
- 用更稠密的梯度来奖励贡献多的代理，稀疏一点的梯度则分配给贡献不那么多的代理
- 通过一个掩码操作（mask operation）:但一个代理的值（贡献）更高时，这个方法将更少的全局梯度中的小组件归零，从而获得更高质量的奖励
- 代理 $i$ 在第 $t$ 次沟通轮次下载的权重可表示为 $gradient_i^t=\text{mask}(u^t_{N},[Dtanh(\beta r_i^t)/\underset{j\in N}{max}\text{tanh}(\beta r_j^t)]$ 其中 $\text{mask}(u^t_N,x)$ 表示返回 $u_N^t$ 前 $x$ 个最大的组件, $D$ 是全局地图的总共的组件数量，这个 $\beta$ 越小，返回的组件数就越少；在极端情况下，当 $\beta =\infty$ 是，新的模型梯度分配与传统模型梯度分配相同
- 如果一个代理没用贡献或者对联邦学习会造成伤害，那么就不会给它分配梯度
回报分配：
- 一方面： $r_i^t<0$ 就说明这个代理在对联邦学习造成伤害
- 另一方面：代理的贡献具有延迟，对这个代理进行补偿
  - 通过查看在之前几轮的值，可以估计这个代理延迟的贡献
  - 在第 $t$ 轮次对代理 $i$ 进行补偿，补偿的值为当前轮次贡献的值减去前几轮次贡献的值的平均值的差 $\mu_i^t=max(r_i^t-\frac{1}{t-1}\sum^{t-1}_{m=1}r_i^m,0)$
- 代理 $i$ 在轮次 $t$ 中获得回报是 $\text{payoff}_i^t = \begin{cases} r_i^t & \text{if } r_i^t < 0 \\ r_i^t+\mu_i^t & otherwise \end{cases},$ $\text{payoff}_i^t\leftarrow\frac{\text{payoff}_i^t}{\sum^{N}_{i=1}\text{payoff}_i^t}$

3.2 Agent Valuation Function

一个代理的价值通常是由它们在辅助验证集上的准确性决定的
为了将代理的价值评估和验证过程分离，引入了两个标准：
- 梯度对齐
  - 使用梯度信息来作为计算Shapley值的值函数，起名为gradient-based Shapley value
    - 公式为 $v(S)=cos(u_S,u_N)=<u_S,u_N>/(\vert \vert u_S\vert \vert,\vert \vert u_N\vert \vert)$ 其中 $u_s$ 是一部分代理的梯度， $u_N$ 是全局梯度
  - 但是计算真的gradient-based shapley value，需要耗费大量时间，所以在 $t$ 轮次代理 $i$ 的gradient-based shapley value为： $\phi^t_i\approx cos(u^t_S,u^t_N)$
- 图复杂度
  - 考虑图复杂度的两个原因：
    - 如果评价紧紧依靠梯度评估，那么具有传输延迟的代理可能就会被低估
    - 复杂的图包含复杂结构模式，导致更好的泛化
  - 采用模体（motif）来代表图数据的多样性
  - 定义1：对于每个代理，将其本地图数据中模体的容量定义为图多样性；对于代理 $i$ 的图多样性 $d_i$ 可以被定义为 $d_i=\frac{k_i}{K}$ 其中， $k_i$ 表示代理 $i$ 本地图数据中独特的模体的数量， $K$ 表示所有代理贡献的总数据中独特的模体的类别
  - 考虑图复杂度的好处还有防止参与训练的代理最终收敛的相似模型中
代理价值的更新：
- 综合考虑两方面因素：
  - 结合图对接和图多样性
  - 同时考虑当前轮次的评估和历史评估
- 公式可表示为： $r_i^t=r^{t-1}_i+\alpha_1(\phi_i^t+\alpha_2d_i),r_i^t\leftarrow r_i^t/\sum_{j\in N}r_j^t$ 其中 $\alpha_1$ 作为当前轮次和历史轮次之间的平衡， $\alpha_2$ 视为图对齐和图多样性之间的平衡，初始化 $r_i^0=1$

3.3 Model Quality Enhancement

Motif Prototypes
- 在结构化数据中富含的子结构，能够在不同图之间代表相似的结构模式
- 定义：对于第 $k$ 模体，我们将模体原型（motif prototype）定义为属于这个模体的所有图的嵌入向量的均值，公式为： $c^t_{i,k}=\frac{1}{\vert D_{i,k}\vert}\sum_{G\in D_{i,k}}f_{w_i^t}(G)$ 其中 $D_{i,k}$ 是 $D_{i}$ 是由包含第 $k$ 个模体的图实例构成的， $f_{w_i^t}(G)$ 是图实例 $G$ 的嵌入向量， $w_i^t$ 是代理 $i$ 在轮次 $t$ 的嵌入层的参数
- 嵌入向量（embedding vectors）：在机器学习中，嵌入向量是一种将图或子图映射到一个连续向量空间的方法。它们通常用于表示数据的某些特征，使得图数据可以被机器学习模型处理。
- 在服务器与本地代理间进行原型的交流不会造成太多的隐私泄露，这是因为模体原型（motif prototypes）是通过计算图实例的低维表示的平均数据的1维向量，这个过程是不可逆的
基于价值的全局模型聚合（Value-based global model aggregation）
- 模体原型在服务器端聚合的过程：第 $k$ 个模体在轮次 $t$ 的全局原型可以被定义为： $c_{N,k}^t=\frac{\sum_{i\in N_k}\text{ReLU}(r_i^t)\cdot c_{i,k}^t}{\sum_{i\in N_k}\text{ReLU}}$ 其中 $N_k$ 表示包含模体 $k$ 的代理集
- 全局模型梯度的聚合：在服务器中轮次 $t$ 的全局梯度模型记作 $u_N^t$ ，按照下列公式进行聚合： $u_N^t=\frac{\sum^m_{n=1}\text{ReLU}(r_i^t)\cdot u_i^t}{\sum_{i=1}^m\text{ReLU}(r_i^t)}$ 其中 $\text{ReLU}$ 起到了在联邦学习过程中将有负面影响的代理排除在外的作用
- $\text{ReLU}()$ 函数： $f (x) = ma x (0, x)$
本地模型训练Local model training
- 全局模体原型作为代理朝着它们期望的方向训练模型的一个指导
- 为了鼓励本地模型 $c_{i,k}^t$ 向全局模型 $c_{N,k}^t$ 靠近，代理 $i$ 的本地损失函数被定义为： $L(\omega_i,D_i)=L_S(F(D_i),Y)+\lambda\sum_{k}d(c_{i,k}^t,c_{N,k}^t)$ 其中， $L_S$ 是度量模型预测 $F(D_i)$ 与实际标签 $Y$ 之间差异的监督损失函数， $\lambda$ 是一个权衡参数，介于监督损失 $L_S$ 和基于模体原型的正则化之间。

BlueberrymanOnTheWay

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Towards Fair Graph Federated Learning via Incentive Mechanisms

本文介绍了一种用于图联邦学习的公平激励机制，针对参与者自利性问题，通过综合模型梯度和回报分配，引入“模体原型”来优化本地模型，提高全局模型质量。代理的贡献通过梯度对齐和图多样性来衡量，并采用基于价值的全局模型聚合方法，确保各代理在联邦学习中的公平性和隐私保护。该方法激励代理朝全局目标优化，提升整体学习性能和公平性。
复制链接

扫一扫