Deep Learning with Label Differential Privacy

XueDaxuan

已于 2022-05-11 21:59:38 修改

阅读量887

点赞数

分类专栏：先验知识差分隐私 LDP 文章标签：深度学习机器学习算法

于 2022-05-11 21:19:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daxuan1881/article/details/124719067

版权

该文章探讨了在深度学习中，由于标签比数据更敏感，因此提出了一种基于标签差分隐私（Label Differential Privacy, LDP）的保护方法。通过随机响应（Random Response, RR）对标签进行随机化处理，特别是对于多类别问题，文章提出了改进的Generalized Random Response（GRR）算法。文章重点介绍了三个算法：1）多阶段训练，将数据集分割并应用GRR生成随机标签；2）使用先验知识调整随机响应的准确性；3）根据先验概率进行类别选择的随机响应策略。随着数据量增加，这种方法能提升模型性能，并提供了算法详细步骤和应用实例。" 107446444,9378712,使用JS实现九宫格放大图效果,"['JavaScript', '前端开发']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

motivation：数据集分为有（data,label），文章认为label是更为重要的，所以对于label进行隐私保护。

methods：通过随即响应RR将label随机化进行保护。

这篇文章认为数据集中输入标签Label是敏感的，而输入数据被认为不是敏感的，所以这篇文章只需要保护Label的隐私。

主要的创新点有两个，一个是提出了一个新的基于Label DP的多阶段深度学习算法，另一个是提出了一个带有先验知识Prior的经典随机响应算法。

多阶段的好处：1.先验概率越来越好2.数据集越来越多。会使模型更加好。

下面这个公式是GRR算法，与普通的random response算法相比，这个算法是针对多类别的情况，而RR算法只针对二分类情况。公式意思是对每个LabelY采用GRR算法生成一个随机的label Y；以P的概率输出Y的值，以1-P的概率随机输出除了Y的值；

1.文章整个流程是算法3213，算法3是文章中多阶段的训练过程，把数据集分成了T份，在每一份中用算法2得到对应的随机标签，之后将T份进行合并，最终利用合并后的数据进行训练。随着数据集合的增多，对于模型训练也是有很大的好处的。

2.算法2的输入是标签y和先验知识，通过计算1-K个Wk,去求一个最大的k值，求和部分是真实标签在Yk中标签对应的概率和。最终目的是利用先验概率使得随机化后的标签y～输出是正确的概率是最大的。而且每一轮的random res

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。