报告（2022-7-26）

P19777

已于 2022-07-27 09:54:11 修改

阅读量401

点赞数

文章标签：其他

于 2022-07-26 11:13:15 首次发布

本文链接：https://blog.csdn.net/P19777/article/details/125989121

版权

FLOD:Oblivious Defender for Private Byzantine-Robust Federated Learning with Dishonest-Majority

原文:https://eprint.iacr.org/2021/993.pdf

在联邦学习在解决拜占庭问题同时也要保护隐私数据是一个矛盾的问题。一方面，隐私数据保护要求禁止访问单个的梯度信息，因为梯度信息能逆推出原始训练数据。而解决拜占庭问题则需要梯度进行数学分析从而将异常梯度从正常梯度中区分出来。本文提出了FlOD方法，基于汉明距离的方法实现对异常数据的处理，同时使用基于布尔秘密分享的方法实现安全的的两方聚合方案，从而实现了在恶意大多数场景下对上述矛盾问题的解决。

SignSGD

在这里插入图片描述
利用SignSgd得到的梯度值都是-1和1的。

FLOD方案

FLOD和FLTrust类似，依旧再服务器端保存一部分的训练数据Root Dataset，这个训练集可以很小，但是必须是干净的，目的就是提供一个绝对安全的参考值用来判定其他梯度向量是否异常。而且FLOD方案是可以抵御恶意大多数的拜占庭攻击的。接下来就来看看基础方案的整体设计：
在这里插入图片描述

Encoding

SignSGD得到的梯度值都是-1或者0。为了后面能计算汉明距离和使用密码学工具，先将其编码到 ${0,1}$ 上来。
在这里插入图片描述

HD-Computing

对上述Encoding的结果分别与服务器端梯度更新来计算两者的汉明距离，具体如下：
在这里插入图片描述
得到的结果就是汉明距离，后面会以汉明距离为基础来判定数据是否异常，那么为什么汉明距离能够其作用呢？证明如下：

证明表明，余弦距离和本文使用得汉明距离是具有线性关系得，因此可以使用汉明距离直接替换汉明距离。