privacy-preserve deep learning

最新推荐文章于 2022-08-10 12:44:41 发布

置顶

Julia_luofang

最新推荐文章于 2022-08-10 12:44:41 发布

阅读量925

点赞数

分类专栏：论文

本文链接：https://blog.csdn.net/weixin_43978453/article/details/104547404

版权

本文探讨了深度学习中隐私问题，提出了一种通过选择性共享模型参数来保护隐私的方法。利用稀疏向量技术和差异隐私，减少了参数选择和上传时的隐私泄露。实验表明，即使只上传小部分参数，也能实现比传统方法更强的隐私保护，同时保持模型的准确性。此外，论文还讨论了分布式随机梯度下降的优势，以及如何在不同数据集和网络架构上应用该方法。

摘要由CSDN通过智能技术生成

背景：
大规模搜集数据来进行深度学习造成了严重的隐私问题。
带来的问题：
1.收集这些数据的公司会永远保存这些数据；从中收集数据的用户既不能删除这些数据，也不能控制如何使用这些数据，也不能控制从他们的数据中学习到的多少。
2.图像和语音记录往往包含意外捕捉到的敏感物品面部、车牌、电脑屏幕、他人说话的声音和环境噪音等。
3.公司保存的用户数据要接受传票和搜查令，以及国家安全和情报机构的无担保间谍活动
4.互联网巨头对从数百万用户收集的“大数据”的垄断导致了他们对从这些数据中学习到的人工智能模型的垄断。

这篇论文的主要创新点在于有选择的共享模型的参数。
这种参数共享的方法，使得即使没有额外的保护，已经实现了比任何现有的方法都更强大的隐私。系统中唯一的泄漏不是直接显示所有训练数据，而是通过一小部分神经网络参数间接泄漏。为了尽量减少这种泄漏，我们展示了如何使用稀疏向量技术将差异隐私应用于参数更新，从而减少由于参数选择（即，选择要共享的参数）和共享参数值造成的隐私损失。

该论文中深度学习系统的架构：
在这里插入图片描述 DSSGD假设两个或多个参与者同时独立训练。在每一轮local training之后，每个参与方都可以异步选择梯度进行共享（上传）。每个参与方可以控制需要上传的梯度的个数以及共享的频率。中心服务器可以根据上传的梯度更新相应的参数。

元参数：
在这里插入图片描述

DSSGD在各个参与方中的过程
在这里插入图片描述
选择初始化参数 $w^{(i)}$ 和学习率α
repeated：
（1）从server上下载 $θ_d$ x $w{(i)}$ 的参数并替换相应的本地参数。
（2）在本地数据集上跑SGD，并更新 $w{(i)}$ .
这里的SGD一般采用mini-batch SGD（随机选择一组大小为M的batch），当然，也可以使用SGD。
（3）对于所有的parameters计算其梯度 $w^{(i)}$
（4）上传 $w_s^{(i)}$ 到server.
那么，到底应该如何上传呢？上传多少呢？
论文中提到了两种上传梯度的方案：
（1）选取对模型贡献最大的 $θ_u$

最低0.47元/天解锁文章

Julia_luofang

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
privacy-preserve deep learning

背景：大规模搜集数据来进行深度学习造成了严重的隐私问题。带来的问题：1.收集这些数据的公司会永远保存这些数据；从中收集数据的用户既不能删除这些数据，也不能控制如何使用这些数据，也不能控制从他们的数据中学习到的多少。2.图像和语音记录往往包含意外捕捉到的敏感物品面部、车牌、电脑屏幕、他人说话的声音和环境噪音等。3.公司保存的用户数据要接受传票和搜查令，以及国家安全和情报机构的无担保间谍活动...
复制链接

扫一扫

专栏目录