Poisoning Deep Learning based Recommender Model in Federated Learning Scenarios

缄默的天空之城

已于 2022-07-30 14:59:45 修改

阅读量324

点赞数 1

分类专栏： Xidian科研经验谈文章标签：深度学习人工智能机器学习

于 2022-07-30 14:57:50 首次发布

本文链接：https://blog.csdn.net/weixin_42139772/article/details/126072225

版权

Xidian科研同时被 2 个专栏收录

40 篇文章 9 订阅

订阅专栏

经验谈

14 篇文章 0 订阅

订阅专栏

1. What does literature study?

本文探讨对象：在联邦学习下针对基于深度学习的推荐模型设计攻击方法。根据两种攻击策略（随机近似和硬用户挖掘）为受操控的恶意用户生成有毒梯度。

2. What’s the innovation?

Past shortcomings
a. 具有攻击者先验知识（交互，不能访问）的现有攻击不适用于联邦场景。
b.不具有攻击者先验知识的现有攻击其攻击效果不佳。
innovation:
a.没有先验知识前提下，在联邦场景中对基于深度学习的推荐模型中毒攻击。
b.首先对良性用户的嵌入向量近似，然后基于近似向量而非边信息生成中毒梯度。
c.提出两种攻击方法，利用不同的方法近似良性用户的嵌入向量（1. 利用高斯分布近似；2. 首先利用高斯分布近似，然后通过梯度下降优化向量来挖掘硬用户）

3. What was the methodology?

采用NCF作为基本推荐模型
预测分数： $\hat{Y}_{u i}=\bold\Upsilon\left(\bold{p}_{u}, \boldsymbol{q}_{i}\right)$ ，NCF利用MLP来学习交互函数 $\bold\Upsilon$ ， $\bold\Upsilon\left(\bold{p}_{u}, \boldsymbol{q}_{i}\right)=\bold a_{out}(h^T\Phi(\boldsymbol{p}_{u}\oplus \boldsymbol{q}_{i}))$ ，
损失函数： $\mathcal{L}_{u}\left(p_{u} ; \Theta\right)=-\sum_{\left(i, Y_{u i}\right) \in \mathcal{D}_{u}} Y_{u i} \log \hat{Y}_{u i}+\left(1-Y_{u i}\right) \log \left(1-\hat{Y}_{u i}\right)$

训练过程:
每个训练轮，中央服务器随机选择一部分用户参与训练，对其发送参数集合 $\Theta^t$ 的副本；每个被选择的用户利用 $\mathcal{L}_{u}$ 求出 $p_u^t$ 的梯度 $\nabla p_u^t$ 来更新 $p_u^t$ 求出 $\Theta^t$ 的梯度 $\nabla \Theta^t_u$ 并上传到服务器；最后，服务器聚合所有接收的梯度来更新 $\Theta^t$ 。
攻击： $\bold{\mathcal{U}}$ 代表良性用户集 $\tilde{\bold{\mathcal{U}}}$ 代表恶意用户集，目的是提高目标项目集合的曝光率
1. 随机近似攻击
2. 硬用户挖掘

4. What are the conclusions?

在这里插入图片描述

5. others

大多数的攻击旨在通过提高目标项目预测分数，将目标项推荐给尽可能多的用户。
数据中毒攻击：将虚假交互注入到训练数据，由于只能注入有效数量的虚假交互，因此攻击效率较低。
模型攻击：生成中毒梯度，取决于攻击者的先验知识（项目受欢迎程度；公共交互）
每个用户对应一个用户客户端，item-score对 $(\bold i,Y_{ui})$ ， $Y_{ui}\in\{0,1\}$
BCE（Binary Cross-Entropy）二元交叉熵损失
对于每个用户，推荐模型为用户推荐没有交互项目中预测得分最高的K项，项目 $i$ 的曝光率为（ER@K）， $\tilde{\bold{\mathcal{I}}}$ 表示目标项目集， $\varepsilon_i$ 表示项目 $i$ 的曝光率，攻击的目的是提高目标集的ER@K，即最大化 $\sum_{i \in \tilde{\bold{\mathcal{I}}}} \varepsilon_i$ ，为了实现这个目的，攻击者操纵恶意用户将设计好的中毒梯度上传到中央服务器。
$\tilde{\bold{\mathcal{L}}}$ 表示攻击目标的损失函数，曝光率ER@K不能代入，因为其高度不可微，不连续；其次攻击者不知道每个良性用户的嵌入向量和训练数据集。
采用的数据集中评分和评论转换为隐式数据，划分数据集为4:1，
根据两种攻击策略（随机近似和硬用户挖掘）为受操控的恶意用户生成有毒梯度。
Attack with Random Approximation (A-ra)
Attack with Hard User Mining (A-hum)
两个基线模型：
随机攻击RA
显式增强EB