非常棒的一篇文章:
https://blog.csdn.net/houzhizhen/article/details/78327217
用我自己简洁的语言来总结一下:
差分攻击:
医院发布了一系列信息,说我们医院这个月有100个病人,其中有10个感染HIV。假如攻击者知道另外99个人是否有HIV的信息,那么他只需要把他知道的99个人的信息和医院发布的信息比对,就可以知道第100个人是否感染HIV。这种对隐私的攻击行为就是差分攻击。
差分隐私:
在查询结果中加入随机性!!
研究训练利用的是大量的数据,而不是单单的个人数据,所以可以保证在大量数据输出结果在一个可接受的范围下波动的时候,我们通过某方法(目前有两种方法①Laplace机制②指数机制)改变个人的输出结果概率。例如我们在研究时,100个病人输出的结果大概率为10个HIV,极小可能为9个或11个HIV,这样并没有影响我们的研究,但在对个人查询时,我们是有概率的得到他是HIV或者不是HIV,有概率我们就不能肯定他就是HIV,所以对个人隐私起到了很好的保护作用。