差分隐私基础知识-上

本文介绍了差分隐私的基本定义,包括全局和局部敏感度,以及差分隐私的性质,如后传性、平行组合和顺序组合。讨论了数值性查询的Laplace和高斯机制,并提及非数值性查询的指数机制。还概述了差分隐私在机器学习,特别是与联邦学习的关系。
摘要由CSDN通过智能技术生成

差分隐私定义:

假设一个随机函数 M , 使得 M 在任意两个相邻的数据集 D 和 D’(即||D -D'||_1 <= 1)上得到任意相同输出集合 S 的概率满足:
Pr[M(D) ∈ S] ⩽ exp(ε) * Pr[M(D′) ∈ S] + δ 则称该随机函数 M 满足(ε,δ)-differential privacy,简写为(ε,δ)-DP
这种形式的差分隐私是宽松的. 当 δ=0 时,称为 ε-DP也就是纯差分隐私定义. 其中 ε 称为隐私预算.

部分内容说明

  • 隐私损失
    差分隐私(DP)的定义实际上是保证去掉/改变一个样本不会对 M 的输出造成显著的影响。换言之,DP保证了 M(D)M(D') 有着相似的概率分布。
    按照DP的定义,如果 M(D)M(D') 的概率分布相差越大,那么隐私损失就越大;如果 M(D)M(D') 的概率分布相差越小,那么隐私损失就越小。

  • 邻近数据集:只相差一条记录的一对数据集. 即 ||D - D′||_1 <= 1.

  • 查询函数: f: X -> R, 主要作用是将数据集 X 映射成为 R

  • 全局敏感度 :GS_f(D) = Δf = max(D,D′) ∥f(D)−f(D′)∥1. ∥f(D)−f(D′)∥1 是 f(D) 与 f(D‘) 之间的曼哈顿距离
    全局敏感度反映了一个查询函数在一对相邻数据集上进行查询时变化的最大范围。它与数据集无关, 只由查询函数本身决定

  • 局部敏感度 :LS_f(D) = Δf = max(D′) ∥f(D)−f(D′)∥1. ∥f(D)−f(D′)∥1 是 f(D) 与 f(D‘) 之间的曼哈顿距离
    与全局敏感度不同, 局部敏感度是由查询函数和给定的数据集共同决定, 因为局部敏感度只是对于一个数据集做变化。
    局部敏感度和全局敏感度的关系可以表示为:S(f) = max(D) {LS_f(D)}
    容易看出,局部敏感度会与数据分布有很强的关联,但全局敏感度一般较大. 故在需要使用局部敏感度时,常采用局部敏感度的平滑上界.

  • 平滑上界
    给定一个 β > 0 , 对于一个函数 F:D --> R , 在查询函数 f 上, 如果它满足如下条件
    ∀D:F(D) >= LS_f(D) , ∀D,D’:F(D) <= exp(β) * LS_f(D’) 则称函数 F 是一个在查询函数 f 上的

  • 5
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值