差分隐私-扰动机制_差分隐私高斯噪声-CSDN博客

本文链接：https://blog.csdn.net/qq_65213554/article/details/148351599

在本地差分隐私（LDP）中，每个用户在本地扰动自身数据后再上传，数据收集者无法获知真实值。
核心公式：
对二值数据（如回答“是/否”），用户按以下规则响应：

隐私预算 ϵ与 p的关系：

经典例子（Warner's Model）： 用户有一个敏感布尔属性（例如是否患病）。用户抛两次硬币：
- 第一次硬币：如果是正面，则如实回答；如果是反面，则抛第二次硬币并根据第二次的结果回答是或否（随机）。
- 通过设计第一次硬币正面/反面的概率，可以控制隐私水平（ε）并能在聚合层面从扰动后的数据中无偏地估计真实比例。

实例：

适用场景： LDP 场景下收集聚合统计信息（如频率估计、均值、直方图），用户不信任数据收集者。广泛用于浏览器、移动应用收集用户行为统计（如 Google 的 RAPPOR）。
变种： 有多种推广形式，如 k-ary 随机响应（处理多个类别）、最优本地哈希（OLH）、分段机制（Piecewise Mechanism）、和谐机制（Harmony Mechanism）等，用于更高效或更精确地处理不同类型的数据和查询。
优点： 提供强隐私保证（本地模型），用户完全控制隐私，用户数据在离开设备前已匿名化。实现相对简单。
缺点： 要达到与中心化模型相同的精度，通常需要更多的用户（样本量），因为每个用户添加的噪声相对较大。主要适用于聚合统计。

向数值型查询结果添加拉普拉斯噪声，噪声规模由全局敏感度 Δf和隐私预算ϵ决定：

关键点：

向数值查询添加高斯噪声，提供 (ϵ,δ)-DP 松弛保证：

其中是 L2 敏感度（相邻数据集查询结果的欧氏距离最大值）。

场景：训练逻辑回归模型，保护训练样本隐私。

关键优势：