本地化差分隐私（Local Differential Privacy）浅析

Ano_onA

已于 2022-05-19 13:45:03 修改

阅读量2.6w

点赞数 30

分类专栏： Differential Privacy 文章标签：本地化差分隐私 Local Differential Privacy

于 2019-09-16 20:51:35 首次发布

本文链接：https://blog.csdn.net/Ano_onA/article/details/100760362

版权

Differential Privacy 专栏收录该内容

5 篇文章

订阅专栏

书接上文，这次来谈谈本地化差分隐私：

一、背景

传统的差分隐私是将原始数据集中到一个数据中心，然后在此对数据施加差分隐私算法，并对外发布，称之为中心化差分隐私（Centralized Differential Privacy）。因此，中心化差分隐私有一个前提：可信的第三方数据收集者，即保证所收集的数据不会被窃取和泄露。然而，在实际生活中想找到一个真正可信的第三方数据收集平台十分困难，这极大地限制了中心化差分隐私的应用。

鉴此，本地化差分隐私应运而生，基于不可信第三方的前提下，其将数据隐私化的工作转移到每个用户，用户自己来处理和保护个人数据，极大地降低了隐私泄露的可能性。

中心化差分隐私与本地化差分隐私数据处理框架，如下图所示：

中心化差分隐私数据处理框架图本地化差分隐私数据处理框架图

二、定义

任意本地化差分隐私函数，定义域为 Dom(f) ，值域为 Ran(f) ，对任意输入， $t^{'}$ $\in$ Dom(f) ，输出 $t^{*}$ $\in$ Ran(f) ，都有：

[ f(t) = $t^{*}$ ] $\leq$ $e^{\varepsilon }$ $\times$ [ $f(t^{'})$ = $t^{*}$ ]

注意：a. 本地化差分隐私技术通过控制任意两条记录的输出结果的相似性，从而确保算法满足本地化差分隐私，即输出同为 $t^{*}$ ，窃密者无法确认输入为还是 $t^{'}$ ；

b. $\varepsilon$ 越小，任意两条记录输出结果相似性越高；反之，亦然。

三、扰动机制

目前，随机响应(randomized response) 技术是本地化差分隐私保护技术的主流扰动机制，如下：

1、扰动性统计

引入一个现实场景：有个用户，假设AIDS患者的真实比例为 $\pi$ 。我们希望对其比例进行统计，于是发起一个敏感的问题：“你是否为AIDS患者? ”，每个用户对此进行响应，第个用户的答案为 $X_{i}$ 是或否，但出于隐私性考虑，用户不会直接响应真实答案．假设其借助于一枚非均匀的硬币来给出答案，其正面向上的概率为，反面向上的概率为 1-p 。抛出该硬币，若正面向上，则回答真实答案，反面向上，则回答相反的答案。