什么是差分隐私?
网上搜到的很多例子都是针对单次查询,为了蒙蔽那些通过有限次查询企图获得奇怪知识的人。
比如攻击者发现一个医院原本有20个人患肺病,现在他发现有个人A去了一趟医院,然后再次查询发现这家医院已经有21人患肺病,由此推断A患肺病。
解决办法是:令查询不能简单获得直接结果,而是获得一个概率(比如正态分布,查询结果在15-25不等)这样单次查询毫无意义,因为实际20患病查询结果可能是25,实际21患病的时候查询结果可能反而是19,总之就是令人迷惑。但是如果能进行若干次查询,就会发现查询结果符合某个概率分布,而次数最多的那个结果就是正确答案(多次查询试错)。
具体做法是:添加噪声。