差分隐私基础知识-上

_RichardYang

已于 2022-03-23 22:46:17 修改

阅读量7.3k

点赞数 5

分类专栏：差分隐私文章标签：安全机器学习人工智能

于 2022-02-27 22:24:51 首次发布

本文链接：https://blog.csdn.net/qq_44916191/article/details/123171724

版权

本文介绍了差分隐私的基本定义，包括全局和局部敏感度，以及差分隐私的性质，如后传性、平行组合和顺序组合。讨论了数值性查询的Laplace和高斯机制，并提及非数值性查询的指数机制。还概述了差分隐私在机器学习，特别是与联邦学习的关系。

摘要由CSDN通过智能技术生成

差分隐私定义：

假设一个随机函数 M , 使得 M 在任意两个相邻的数据集 D 和 D’(即||D -D'||_1 <= 1)上得到任意相同输出集合 S 的概率满足：
Pr[M(D) ∈ S] ⩽ exp(ε) * Pr[M(D′) ∈ S] + δ 则称该随机函数 M 满足(ε,δ)-differential privacy，简写为(ε,δ)-DP
这种形式的差分隐私是宽松的. 当 δ=0 时，称为 ε-DP也就是纯差分隐私定义. 其中 ε 称为隐私预算.

部分内容说明

隐私损失
差分隐私（DP）的定义实际上是保证去掉/改变一个样本不会对 M 的输出造成显著的影响。换言之，DP保证了 M(D) 和 M(D') 有着相似的概率分布。
按照DP的定义，如果 M(D) 和 M(D') 的概率分布相差越大，那么隐私损失就越大；如果 M(D) 和 M(D') 的概率分布相差越小，那么隐私损失就越小。
邻近数据集：只相差一条记录的一对数据集. 即 ||D - D′||_1 <= 1.
查询函数: f: X -> R，主要作用是将数据集 X 映射成为 R
全局敏感度：GS_f(D) = Δf = max(D,D′) ∥f(D)−f(D′)∥1. ∥f(D)−f(D′)∥1 是 f(D) 与 f(D‘) 之间的曼哈顿距离
全局敏感度反映了一个查询函数在一对相邻数据集上进行查询时变化的最大范围。它与数据集无关, 只由查询函数本身决定
局部敏感度：LS_f(D) = Δf = max(D′) ∥f(D)−f(D′)∥1. ∥f(D)−f(D′)∥1 是 f(D) 与 f(D‘) 之间的曼哈顿距离
与全局敏感度不同, 局部敏感度是由查询函数和给定的数据集共同决定, 因为局部敏感度只是对于一个数据集做变化。
局部敏感度和全局敏感度的关系可以表示为：S(f) = max(D) {LS_f(D)}
容易看出，局部敏感度会与数据分布有很强的关联，但全局敏感度一般较大. 故在需要使用局部敏感度时，常采用局部敏感度的平滑上界.
平滑上界
给定一个 β > 0 , 对于一个函数 F:D --> R , 在查询函数 f 上, 如果它满足如下条件
∀D：F(D) >= LS_f(D) ， ∀D,D’：F(D) <= exp(β) * LS_f(D’) 则称函数 F 是一个在查询函数 f 上的

最低0.47元/天解锁文章

_RichardYang

关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
差分隐私基础知识-上

差分隐私定义：假设一个随机函数 M , 使得 M 在任意两个相邻的数据集 D 和 D’(即||D -D'||_1 <= 1)上得到任意相同输出集合 S 的概率满足：Pr[M(D) ∈ S] ⩽ exp(ε) * Pr[M(D′) ∈ S] + δ 则称该随机函数 M 满足(ε,δ)-differential privacy，简写为(ε,δ)-DP这种形式的差分隐私是宽松的. 当 δ=0 时，称为 ε-DP也就是纯差分隐私定义. 其中 ε 称为隐私预算.部分内容说明隐私损失差分隐私（DP
复制链接

扫一扫

专栏目录