中心化差分隐私和本地差分隐私
-
定义区别:在中心化差分隐私保护技术中,算法膨的隐私性通过近邻数据集来定义,因此其要求一个可信的第三方数据收 集者来对数据分析结果进行隐私化处理.对于本地化差分隐私技术而言,每个用户能够独立地对个体数据进行 处理,即,隐私化处理过程从数据收集方转移到单个用户端上,因此不再需要可信第三方的介入,同时也免除了 不可信第三方数据收集者可能带来的隐私攻击.
-
异同点
- 组合特性
差分隐私技术具有序列组合性和并行组合性两种特性,序列组合性强调隐私预算可以在方法的不同步 骤进行分配,而并 行组合性则是保证满足差分隐私的算法在其数据集的不相交子集上的隐私性.从定义上来看,中心化差分隐私定义在近邻数据集上,本地化差分隐私则是定义在其中的两条记录上,而隐私保证的形式并未发生变化,因此本地化差分隐私将上述两种组合特性继承下来,下面给出形式化定义.
- 可信第三方和不可信第三方
- 噪声机制
中心化差分隐私:拉普拉斯机制(连续型数据查询),指数机制(离散型数据查询)两种机制都和查询函数的全局敏感度相关,而全局敏感性则是定义在至多 相差一条记录的近邻数据集之上,使得攻击者无法根据统计结果推测个体记录,即将个体记录隐藏在统计结果 之中
本地化差分隐私中,每个用户将各自的数据进行扰动后,再上传至数据收集者处,而任意两个用户之间 并不知晓对方的数据记录,本地化差分隐私中并不存在全局敏感性的概念,因此,拉普拉斯机制和指数机 制并不适用. - 应用场景
- 组合特性