目录
首先什么是差分隐私?
e-DP差分隐私算法:给对于两个数据集D和D’,D和D’相差一条记录,记作|DΔD'|≤1,一个随机算法A,S为A在D和D’数据集上输出的结果,S∈range(A),符合下面的公式,则称A满足e-DP差分隐私:
Pr[]是隐私被泄露的概率,e是指隐私保护参数,可以表示隐私保护的程度,它越小,隐私保护越好,但是加入的噪声就越大,数据可用性就下降了
通俗而言,在数据集中修改一条数据,不会对算法输出的分布带来太大的影响,当攻击者观察输出结果S时,很难区分出数据到底来自D还是D’。
差分隐私噪声机制
差分隐私技术中的常用机制,将噪声插入到查询结果中,使得数据失真或者扰乱数据。
1、拉普拉斯机制
Laplace概率密度函数为:
Laplace噪声机制满足EXP-差分隐私:
证明Laplace噪声机制满足exp-差分隐私:
拉普拉斯分布的python代码:
2、指数机制
常用于评估输出值的优劣程度。
当接收到一个查询之后,不是确定性的输出一个结果,而是以一定的概率值返回结果。
敏感度:
指数机制满足差分隐私:
证明:
3、高斯机制后面看到了再补上
参考: