密码学小知识(9)：差分隐私（Differential Privacy）

cryptocxf

已于 2024-04-11 20:21:58 修改

阅读量3.2k

点赞数 4

分类专栏：密码学相关知识文章标签：差分隐私隐私

于 2022-04-21 17:22:28 首次发布

本文链接：https://blog.csdn.net/a33280000f/article/details/124326329

版权

密码学相关知识专栏收录该内容

9 篇文章 66 订阅

订阅专栏

首先要明白什么是隐私？若单个用户的某个属性可以是隐私，而一群用户的某个属性就可以不看做隐私了。例如，张三喜欢抽烟，所以得了肺癌。这个“张三得了肺癌”这条信息就是隐私。而医院里，抽烟的人容易得肺癌，这就不属于隐私。

因此，差分隐私是来保护隐私的密码学技术，通过对查询的结果加入噪声，而使得攻击者无法判断某个样本是否在数据集中。

差分隐私（Differential Privacy），简称DP，旨在传输的梯度信息中加入随机噪声，并将其查询操作的实际结果隐藏起来或者模糊化，直至无法区分，从而实现对私密数据的保护。

DP是Dwork在2006年提出的一种严格可证明的隐私保护技术。其核心思想是对于差别只有一条记录的两个数据集 $D$ 和 $D ‘$ ，查询它们获得相同值的概率非常接近。这两个数据集称为邻居（相邻）数据集。

定义：令 $M$ 为随机算法， $D$ 和 $D^{'}$ 为相邻数据集，若 $M$ 在 $D$ 和 $D^{'}$ 上任意输出的结果 $S$ 都满足如下式子，则称 $M$ 实现了 $(\epsilon, \delta)$ 差分隐私。
$Pr(M(D)\in S) = e^{\epsilon}\times Pr(M(D')\in S) + \delta$
其中参数 $\epsilon$ 称为隐私预算，代表了差分隐私技术所实现的隐私保护程度， $\epsilon$ 值越小表示隐私保护程度越高。 $Pr(M(D)\in S)$ 表示随机算法 $M$ 的输出属于集合 $S$ 的概率。 $\epsilon$ 表示违背严格差分隐私的概率，若 $\delta = 0$ ，则随机算法 $M$ 表示严格的 $\epsilon-$ 差分隐私，否则为松弛差分隐私。

常用的实现隐私保护的机制有拉普拉斯噪声机制[1]和指数噪声机制[2]，这里我并没有继续深入阅读，后续可能会继续展开。

[1] Dwork C, Roth A. The algorithmic foundations of differential privacy[J]. Foundations and Trends in Theoretical Computer Science, 2014, 9(3-4): 211-407.
[2] McSherry F, Talwar K. Mechanism design via differential privacy[C]. 48th Annual IEEE Symposium on Foundations of Computer Science, 2007.

cryptocxf

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
密码学小知识(9)：差分隐私（Differential Privacy）

首先要明白什么是隐私？若单个用户的某个属性可以是隐私，而一群用户的某个属性就可以不看做隐私了。例如，张三喜欢抽烟，所以得了肺癌。这个“张三得了肺癌”这条信息就是隐私。而医院里，抽烟的人容易得肺癌，这就不属于隐私。因此，差分隐私是来保护隐私的密码学技术，通过对查询的结果加入噪声，而使得攻击者无法判断某个样本是否在数据集中。差分隐私（Differential Privacy），简称DP，旨在传输的梯度信息中加入随机噪声，并将其查询操作的实际结果隐藏起来或者模糊化，直至无法区分，从而实现对私密数据的保护。D
复制链接

扫一扫