differential privacy学习笔记(一)
什么是differential pravicy
differential privacy通常被翻译成差分隐私,为了了解什么是差分隐私,我们需要定义一下这个隐私是什么
我们通常理解为单个的数据即为隐私,例如我们可以在每年的人口普查中知道人均月收入为多少,但不能够轻易地获得具体的某个人比如小明他的月收入是多少,在这个问题中小明的月收入信息就是隐私,而人均月收入就是一个统计信息,这个统计信息通畅来说是有意义的,比如国家统计的GPA,可以显示出国家的发展速度,因此统计数据分析是有意义的,不可少的,但是作为小明,那他就会想到,会不会有别有用心的人能够通过这个统计结果能够分析出我的月收入是多少,这就涉及到隐私保护的问题。
一些隐私保护方案和攻击手法
通常我们能够想到的保护隐私的方式是抹去一些隐私信息,比如我们在参加调查问卷的时候,会更愿意参加那些不用提供个人信息的调查,但是单纯的抹去敏感信息并不能保证隐私的安全性。
上图是一个医院的患者信息表,把姓名信息进行了处理,但如果攻击者拥有下面这个表,然后将信息进行对应,很容易轻易地得到张三得了流感这一信息。