1.中心化对应全局敏感度,本地化对应局部敏感度。
通过差分隐私使得查询函数对单个输入的体现出不敏感性。局部敏感度解决全局敏感度过大的问题,平滑敏感度解决局部敏感度的敏感度泄露的问题。这些问题总结来说都是并不能反映函数对单个输入的典型不敏感性。
2.全局敏感度在修改一个元祖时查询结果的最大变化。对于和、计数、最大值全局敏感度很容易计算。例如计数的全局敏感度为1,因为对于任何两个相邻的数据集,只要一个元祖被更改,而对于直方图查询的全局敏感度为2,示例图如下:
3.为什么需要局部敏感度?当全局敏感度较大时,必须像输出中添加大量的噪声以实现差分隐私,这就有可能严重损害数据效用。为了解决这个问题,Nissim等人提出了局部敏感度的思想。
4.敏感度是决定加入噪声大小的关键参数,它指删除数据集中任一记录对查询结果造成的最大改变。差分隐私中定义了两种敏感度,即全局敏感度和局部敏感度。
6.局部敏感度利用了数据集的数据分布特征,通常要比全局敏感度小的多。但是,局部敏感度在一定程度上体现了数据集的数据分布特征,如果直接应用局部敏感度来计算噪声量则会泄露数据集中的敏感信息,因此局部敏感度的平滑上界被用来与局部敏感度一起确定噪声量的大小。
7.LS噪声量大小:LS的平滑上界和LS一起决定。