READ-2323 Attack of the Tails Yes, You Really Can Backdoor Federated Learning

最新推荐文章于 2024-08-18 23:37:00 发布

VivienneLuo

最新推荐文章于 2024-08-18 23:37:00 发布

阅读量193

点赞数

文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/m0_51638853/article/details/129540966

版权

论文名称	Attack of the Tails Yes, You Really Can Backdoor Federated Learning
作者	Hongyi Wang, Kartik Sreenivasan, Shashank Rajput
来源	NeurIPS 2020
领域	Machine Learning - Federal learning - Security – Semantic backdoor attack
问题	~
方法	使用边缘案例后门对在训练集中代表性不足的任务进行攻击，种边缘案例后门不常发生，但一旦出现，可能会对较小的一类用户组产生影响
创新	提出了边缘案例后门，使用投影梯度下降（PGD）训练模型

黑盒攻击=数据投毒攻击：在良性数据和边缘投毒数据上进行正常的训练
白盒攻击：模型投毒攻击
PGD攻击
若客户端使用SGD太久，会导致模型更新远远的偏离于原始全局模型，容易被梯度裁剪所防御，因此攻击者可以周期性的将模型参数投影到以之前全局模型为球心的球上
①攻击者需选择较小的攻击预算σ（本地更新与全局模型的距离最值），以保证更好的隐蔽性
②攻击者运行PGD，使攻击者的更新投影到以全局模型为球心，以σ为半径的球上
PGD攻击+模型替换

当后门边缘样本数量超过客户端数据集总量的一半以上，可以获得较好的攻击效果
攻击者向DNN提供良性样本，并收集倒数第二层的输出向量，通过拟合获得聚类数量等于类的数量的高斯混合模型，攻击者可以使用该模型测量任何给定样本的概率密度，并在需要时过滤掉

X：第l层的参数
良性模型与恶意模型的差距：
①上限：预防后门与防御恶意样本一样困难，说明证明后门的健壮性与证明模型健壮性一样困难
②下限：如果后门数据与良性数据的最短距离接近0，攻击者所构造的后门是无效的，从而间接证明了使用边缘样本的合理性

本文利用了极端数据，嵌入了一个更加隐蔽的后门，该后门正是利用了数据分布不均匀的情况，使得其他良性客户端难以消除恶意更新。同时，对恶意更新进行投影约束，使得梯度裁剪等方式难以察觉这种攻击。

关注