Differentially Private Publishing of High-dimensional DataUsing Sensitivity Control

motivation:敏感度太高,需要加大噪声去满足DPwe consider the problem of publishing column counts for high-dimensional datasets, such as querylogs or the Netflflix dataset. The key challenge is that as the sensitivity is high, highmagnitude noises need to be added to sati..
摘要由CSDN通过智能技术生成

motivation:针对高维度下数据集的列计数问题,因为敏感度太高,正常加拉普拉斯噪声效果很差(添加一个元祖都为1,每列都会添加1,有d列),所以需要加更多的噪声去满足差分隐私。

methods:所以提出了一种控制敏感度的方法DPSense去降低敏感度从而降低所需要加的噪声。DPsense选择一个阈值,计算有限制的敏感度数据集,然后在列计数添加噪声。为了选择阈值,介绍了一种low-sensitivity quality function,可以利用指数机制选择一个desired θ,我们设计了质量函数来同时考虑数据集的性质和添加噪声的影响,加入的噪声变小,发布的计数更准确,还说明了质量函数和真实的MAE之间的关系,进一步说明了质量函数的优势。在DPSense基础上,进一步提出了一种扩展去修正under-estimation bias​​​​​​​,称为DPsense-SDPSense-S还试图通过同时选择θ和一个比例因子α,从θ限制的数据中产生噪声计数,来纠正由于灵敏度限制而造成的系统低估 ,并将噪声计数乘以α来纠正低估。采用质量函数(θ, α)来估计灵敏度限制、噪声添加和缩放后的误差

experiments:

conclusion:

现有进展:1.在行计数上设置一个上界θ(upper threshold θ),该行可以归一化,使每个非零单元格有一

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值