差分隐私
文章平均质量分 91
粥粥粥少女的拧发条鸟
谈论现实
展开
-
差分隐私代码实现系列数据集及源码
目录差分隐私系列源码及数据集关于差分隐私代码实现系列说明发博客的目的水平有限时间有限个人性格后续安排差分隐私系列源码及数据集Programming Differential Privacy源码及数据集Programming Differential Privacy书关于差分隐私代码实现系列说明最近没上博客在忙开题,发现私信爆了。小伙伴最多的问题是关于《差分隐私代码实现系列》的代码和数据集,这个系列是我自己翻译《Programming Differential Privacy》并且加入了自己的一些看原创 2022-03-18 08:31:45 · 4423 阅读 · 0 评论 -
【差分隐私和数据的适配性】差分隐私代码实现系列(十四)
差分隐私代码实现系列(十四)写在前面的话回顾合成数据直方图添加差分隐私生成表格数据生成更多列总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、本地模型也有一个明显的缺点:在中心差分隐私下,对于与相同查询相同的隐私成本,本地模型中查询结果的准确性通常要低几个数量级。这种准确性的巨大损失意味着只有少数查询类型适用于本地差分隐私,即使对于这些查询类型,也需要大量的参与者。2、当答案本身较小时,本地模型的误差会变大。在误差上,随机响应比中心模型中的拉普拉斯机制差几个数量级。即使本地模型有更好的算法,原创 2022-02-13 11:46:26 · 2074 阅读 · 1 评论 -
【本地差分隐私与随机响应代码实现】差分隐私代码实现系列(十三)
差分隐私代码实现系列(十三)写在前面的话回顾本地差分隐私随机响应一元编码总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、梯度下降是一种通过根据损失的梯度更新模型来使损失变小的方法。梯度就像一个多维导数:对于具有多维输入的函数(如上面的损失函数),梯度体现函数的输出相对于输入的每个维度的变化速度。如果梯度在特定维度中为正,则意味着如果我们增加该维度的模型权重,则该函数的值将增加;我们希望损失减少,因此我们应该通过朝着梯度的反方向来修改我们的模型,即做与梯度相反的事情。由于我们沿梯度相反的方向移原创 2022-02-12 14:43:11 · 4404 阅读 · 3 评论 -
【机器学习与差分隐私代码实现】差分隐私代码实现系列(十二)
差分隐私代码实现系列(十二)写在前面的话回顾机器学习与差分隐私使用 Scikit-Learn 进行逻辑回归什么是模型?使用梯度下降训练模型梯度下降的单一步骤梯度下降算法梯度下降与差分隐私渐变剪切梯度的灵敏度噪音对训练的影响总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、稀疏向量技术对数据集上的敏感度为1的查询流进行操作。它释放流中第一个通过测试的查询的标识,而不是其他任何内容。SVT的优点是,无论考虑多少查询,它都会产生固定的总隐私成本。2、 在这种情况下,我们希望通过放弃对明显低于阈值的原创 2022-02-08 16:39:42 · 6353 阅读 · 4 评论 -
【稀疏向量技术代码实现】差分隐私代码实现系列(十一)
差分隐私代码实现系列(十一)写在前面的话回顾稀疏向量技术发明稀疏向量技术的动机高于阈值`AboveThreshold`算法应用稀疏向量技术返回多个值应用:范围查询总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、指数机制的理解:分析人员通过指定一个评分函数来定义哪个元素是"最佳"的,该评分函数为集合中的每个元素输出一个分数,并定义要从中选取的事物集。该机制通过近似最大化它返回的元素的分数来提供差分隐私,换句话说,为了满足差分隐私,指数机制有时会从没有最高分数的集合中返回一个元素。2、指数机制原创 2022-01-22 16:14:00 · 2150 阅读 · 1 评论 -
【指数机制代码实现】差分隐私代码实现系列(十)
差分隐私代码实现系列(十)写在前面的话回顾指数机制发明指数机制的动机指数机制的描述日期的例子指数机制的特点有限集合的指数机制报告最大噪声算法指数机制作为差分隐私的基本机制总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、大多数隐私成本边界都是有上限的,但它们有时代表非常宽松的上限,即真正的隐私成本远低于上限。开发差分隐私的新变体的主要动机是实现更严格的隐私成本限制,特别是对于迭代算法,同时保持在实践中有用的隐私定义。2、无论我们运行多少个查询,在ϵ\epsilonϵ-差分隐私下,我们都不会比原创 2022-01-22 11:35:26 · 4797 阅读 · 3 评论 -
【Rényi差分隐私和零集中差分隐私(差分隐私变体)代码实现】差分隐私代码实现系列(九)
差分隐私代码实现系列(九)写在前面的话回顾差分隐私的变体发明变体的动机最大散度和Rényi散度Rényi差分隐私零集中差分隐私差分隐私变体的组合情况总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、全局敏感度具有局限性,一个是不好估计,另一个是不太贴近实际情况。就拿均值的敏感度举例,全局敏感度考虑最极端情况就是上限减去下限,同时这个上下限不好估计。并且实际情况肯定不是如此,要考虑具体数据集。2、但是呢局部敏感度又不能像全局敏感度直接用拉普拉斯机制,因为当攻击者知道局部敏感度时(就算不知道多查原创 2022-01-15 21:30:56 · 3395 阅读 · 4 评论 -
【局部敏感度的问题代码实现】差分隐私代码实现系列(八)
差分隐私代码实现系列(八)写在前面的话回顾局部敏感度(Local Sensitivity)均值的局部灵敏度(Local Sensitivity of the Mean)通过局部灵敏度实现差分隐私?建议-测试-发布(Propose-test-release)平滑灵敏度(Smooth Sensitivity)示例和聚合(Sample and Aggregate)写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、通常要求δ\deltaδ非常小,通常为1n2\frac{1}{n^2}n21或更小,其中n原创 2021-12-07 17:38:20 · 2335 阅读 · 2 评论 -
【我们为什么用高斯机制?】差分隐私代码实现系列(七)
差分隐私代码实现系列(六)写在前面的话回顾松弛差分隐私(Approximate Differential Privacy)高斯机制(The Gaussian Mechanism)矢量值函数及其灵敏度(Vector-Valued Functions and their Sensitivities)L1 和 L2 规范(L1 and L2 Norms)L1 和 L2 灵敏度(L1 and L2 Sensitivities)在 L1 和 L2 之间进行选择(Choosing Between L1 and L2)灾原创 2021-12-06 22:05:46 · 7437 阅读 · 4 评论 -
【敏感度,查询,裁剪代码实现】差分隐私代码实现系列(六)
差分隐私代码实现系列(六)写在前面的话回顾敏感性(Sensitivity)距离(Distance)计算灵敏度(Calculating Sensitivity)计算查询数(Counting Queries)求和查询(Summation Queries)平均查询(Average Queries)裁剪(Clipping)总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、顺序组合给出的隐私成本的界限是一个上限,两个特定的差异隐私机制的实际隐私成本可能小于此,但永远不会比这个更大。2、实际的隐私损失似原创 2021-12-06 21:14:12 · 2821 阅读 · 2 评论 -
【差分隐私组合定理,直方图,列联表代码实现】差分隐私代码实现系列(五)
差分隐私代码实现系列(五)写在前面的话回顾差分隐私的属性(Properties of Differential Privacy)顺序组成(Sequential composition)平行组合(Parallel Composition)直方图(Histograms)列联表(Contingency Tables)后处理(Post-processing)总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、与kkk-Anonymity不同,差分隐私是算法的属性,而不是数据的属性。也就是说,我们可以证明原创 2021-12-06 20:14:10 · 5398 阅读 · 4 评论 -
【拉普拉斯机制代码实现demo】差分隐私代码实现系列(四)
差分隐私代码实现系列(四)写在前面的话回顾差分隐私(Differential Privacy)拉普拉斯机制(The Laplace Mechanism)多少噪音就足够了?(How Much Noise is Enough?)总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾1、kkk-Anonymity是数据的一个属性,它确保每个个体都与至少一组kkk个体"融合"。2、kkk-Anonymity甚至在计算上也很昂贵:朴素算法是O(n2)O(n^2)O(n2),更快的算法占用相当大的空间。3、k原创 2021-12-06 16:37:13 · 12530 阅读 · 4 评论 -
【k-匿名(k-Anonymity)代码实现】差分隐私代码实现系列(三)
差分隐私代码实现系列(三)写在前面的话回顾kkk-匿名(kkk-Anonymity)检查kkk-匿名(Checking for kkk-Anonymity)生成满足kkk-匿名的数据(Generalizing Data to Satisfy kkk-Anonymity)数据越多泛化越好?(Does More Data Improve Generalization?)删除异常值(Removing Outliers)总结写在前面的话书上学来终觉浅,绝知此事要躬行。回顾数据:1、显式标识符(ID,能够原创 2021-12-06 15:47:12 · 8318 阅读 · 8 评论 -
【链接攻击,差分攻击,去标识化代码实现】差分隐私代码实现系列(二)
差分隐私代码实现系列(二)写在前面的话去识别化(De-identification)数据处理去识别化操作链接攻击Karrie特别吗?我们可以重新识别多少人?聚合(Aggregation)小团体问题差分攻击总结写在前面的话书上学来终觉浅,绝知此事要躬行。去识别化(De-identification)大家看差分隐私的论文,在introduction总是会看到k匿名化去识别化是从数据集中删除标识信息的过程。术语去识别化有时与术语匿名化(de-identification)和假名化(pseudonymiz原创 2021-12-06 10:47:41 · 3302 阅读 · 12 评论 -
【什么是数据隐私?安全与隐私的区别?】差分隐私代码实现系列(一)
差分隐私编程系列(一)写在前面的话什么是数据隐私?安全和隐私之间的区别?这个系列做了什么?写在前面的话书上学来终觉浅,绝知此事要躬行。什么是数据隐私?数据隐私技术的目标是让分析师了解敏感数据的趋势,而不会泄露特定于个人的信息。这是一个宽泛的定义,许多技术都满足这个定义。但重要的是要注意这个定义排除了什么?那就是确保安全的技术,比如加密。加密数据不会显示任何内容, 因此它无法满足我们定义的第一个要求。安全和隐私之间的区别?隐私技术涉及有意发布信息,并试图控制从该发布中可以学到什么。安全原创 2021-12-05 17:35:33 · 2209 阅读 · 0 评论 -
【线性查询之间存在相关性误差】差分隐私系统学习记录(七)
The Algorithmic Foundations of Differential Privacy (七)写在前面的话Releasing Linear Queries with Correlated ErrorExample 4.1An offline algorithm: SmallDBProposition 4.1. The Small Database mechanism is (ε, 0) differentially private.Theorem 4.2Lemma 4.3 (Sampling原创 2021-11-28 17:22:21 · 696 阅读 · 0 评论 -
【差分隐私发论文朝哪个方向走?】差分隐私的过去,现在和将来
The Past,Present,and Future of Differential Privacy写在前面的话概述现状什么是隐私?Past总结Now相关性数据非结构化数据LDP的问题总结Future写在前面的话《2021网络安全西湖学术论坛线上报告》11.25晚上场由Yang Cao报告,报告内容为《The Past,Present,and Future of Differential Privacy》。大家想看原视频可以去我的b站看,我大致看了报告,但是下文的理解都是个人理解,与原文作者看法无关,原创 2021-11-27 21:41:43 · 1891 阅读 · 0 评论 -
【稀疏向量技术是什么?】差分隐私系统学习记录(六)
The Algorithmic Foundations of Differential Privacy (六)写在前面的话Remarks on compositionWeak QuantificationHumans and GhostsThe sparse vector techniqueThe SettingAlgorithmTheorem 3.23. AboveThreshold is (ϵ, 0)-differentially privateDefinition 3.9 (Accuracy)Theo原创 2021-11-27 19:00:37 · 2613 阅读 · 0 评论 -
【高斯和拉普拉斯为什么分别对应L2和L1?】差分隐私系统学习记录(五)
The Algorithmic Foundations of Differential Privacy (五)写在前面的话Laplace versus Gauss什么是先验分布?后验分布?似然估计?为什么拉普拉斯对应L1,高斯对应L2回到书上写在前面的话有一段时间没更新这个系列了,今天组会完晚上休息一下,再看看这本书。纯属个人笔记,如有问题请看原文或者留下评论。Laplace versus Gauss什么是先验分布?后验分布?似然估计?x: 观察得到的数据(结果)y : 决定数据分布的参数(原原创 2021-11-26 21:34:17 · 3834 阅读 · 1 评论 -
机器学习与差分隐私(认证鲁棒性和隐私保护)
Trustworthy Machine Learning with Differential Privacy and Certified Robustness 写在前面的话研究现状作者的思考DPSGD的优化数据隐私方面的攻击相关工作性能提升工作未来展望其他写在前面的话《2021网络空间安全西湖学术论坛》第二天关于差分隐私的汇报,由Li Xiong教授汇报。汇报的主要内容是《Trustworthy Machine Learning with Differential Privacy and Certifi原创 2021-11-23 16:46:50 · 5422 阅读 · 0 评论 -
顶刊学者带你深度理解本地差分隐私【会议笔记】
Analyzing Sensitive Data with Local Differential Privacy写在前面的话背景知识本地差分隐私存在可优化的部分数据效用随机响应怎么选择合适的方法?考虑偏币情况总结功能扩展挑战1:怎么聚合?挑战2:范围预测?挑战3:多维度查询实验更好的隐私保护结语写在前面的话《2021网络安全西湖学术论坛线上报告》11.22上午场由Tianhao Wang报告,报告内容为《Analyzing Sensitive Data with Local Differential P原创 2021-11-22 20:09:00 · 2773 阅读 · 0 评论 -
差分隐私?联邦学习?安全多方计算?它们之间是什么关系?
差分隐私与其他隐私计算技术的联系写在前面的话隐私计算什么是隐私计算?隐私计算发展趋势隐私计算的技术隐私计算体系结构安全多方计算联邦学习可行执行环境差分隐私比较应用场景发展趋势发展展望总结补充写在前面的话本文纯属个人笔记,仅供参考。隐私计算什么是隐私计算?隐私计算(Privacy-preserving computation)是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。简单来说就是一个技术体系,其目的是实现数据可用原创 2021-11-20 11:21:29 · 21454 阅读 · 0 评论 -
【差分隐私与密码学】密码学入门(一)
Network security - private communication in a public world 密码学(一)写在前面的话Introduction to CryptographyComputational DifficultyTo Publish or Not to PublishSecret CodesBreaking an Encryption SchemeCiphertext OnlyKnown PlaintextChosen PlaintextTypes of Cryptogr原创 2021-11-17 11:16:15 · 1628 阅读 · 0 评论 -
【差分隐私的Advanced composition到底是什么?】差分隐私系统学习记录(四)
The Algorithmic Foundations of Differential Privacy (四)写在前面的话Composition: some technicalitiesAdvanced compositionExperiment b for family F and adversary A:Lecture 4:Composition Theorems回到书上写在前面的话纯属个人笔记,如有问题请看原文或者留下评论。Composition: some technicalities在本节原创 2021-11-16 16:57:54 · 1634 阅读 · 0 评论 -
【差分隐私的指数机制该怎么理解?】差分隐私系统学习记录(三)
The Algorithmic Foundations of Differential Privacy (三)写在前面的话The exponential mechanism写在前面的话纯属个人笔记,如有问题请看原文或者留下评论。The exponential mechanism举个例子:这是一个竞拍收益最大化的问题,指数机制的作用在于隐藏好这些竞拍价格。怎么隐藏?给它们弄一个打分函数u来实现。再举个例子,我们有很多课程,小明最喜欢哪一门呢,这也是一个指数机制的问题。并且从这些例子可以看出,指数机原创 2021-11-16 10:58:09 · 3406 阅读 · 1 评论 -
人工智能的安全问题与差分隐私【笔记】
人工智能的安全问题与差分隐私写在前面的话2021-AI-Index-Report_Master承上启下人工智能模型数据泄露的攻击与防御介绍概述启发Threat of Adversarial Attacks on Deep Learning in Computer Vision: A Survey介绍概述启发差分隐私差分隐私和人工智能成员推理攻击MI攻击面临的四个问题Practical Blind Membership Inference Attack via Differential Comparisons原创 2021-11-17 00:00:00 · 1645 阅读 · 0 评论 -
【数学工具?拉普拉斯机制?随机响应?】差分隐私系统学习记录(二)
The Algorithmic Foundations of Differential Privacy (二) 写在前面的话Basic Techniques and Composition TheoremsUseful probabilistic toolsRandomized responseThe laplace mechanism写在前面的话纯属个人笔记,如有问题请看原文或者留下评论。Basic Techniques and Composition Theorems这一部分介绍差分隐私的机制和原创 2021-11-14 10:05:11 · 2958 阅读 · 1 评论 -
【差分隐私入门】差分隐私系统学习记录 (一)
The Algorithmic Foundations of Differential Privacy (一)写在前面的话The Promise of Differential PrivacyBasic TermsThe model of computationTowards defining private data analysisFormalizing differential privacyWhat differential privacy promisesWhat differential pri原创 2021-11-12 21:47:22 · 2436 阅读 · 0 评论 -
差分隐私与可穿戴式设备调查【笔记】
A Systematic Literature Review on Wearable Health Data Publishingunder Differential Privacy 论文笔记概述under Differential Privacy 论文笔记)概述实时数据中最大的挑战之一是数据之间的高维时间相关性。许多研究人员发现,差异隐私适合于保护实时健康数据中的隐私,并声称这些解决方案比现有的方法具有优势。这证明了差异隐私是一种富有成效的机制,并为保护实时健康数据的隐私提供了一种更实用的方法。据原创 2021-11-12 20:05:10 · 835 阅读 · 0 评论 -
差分隐私与机器学习的综述【笔记】
Differential Privacy and Machine Learning: a Survey and Review 论文笔记总差分隐私部分:机器学习部分:评判标准:基于差分隐私应用在机器学习的一般思想:分基于差分隐私的监督学习:基于差分隐私的非监督学习:基于差分隐私的降维模型:统计估计:总理论结果:讨论:总差分隐私部分:作者在先验知识部分,介绍了查询的概念,这是其他文章没有提到的。在敏感度方面,按照时间线或者说缺陷的改进来说,从全局敏感度到局部敏感度最后到平滑敏感度框架以及采样聚合框架。原创 2021-11-12 19:58:11 · 2436 阅读 · 1 评论 -
差分隐私学习路线【定期更新】
差分隐私学习路线【定期更新】写在前面的话基础知识方向写在前面的话博客,视频,论文和代码实现。有不会的就查,把基础知识打牢。基础知识吃透下面这些,你就差分隐私入门了。网上有些博客写得有问题,有问题一定要从论文入手。这是我自己的学习路线,仅供参考。了解差分隐私基础知识点1基础知识点2系统学习的视频系统学习的书代码方向阅读中文和英文的综述,并且阅读近六年四大顶会上关于差分隐私的论文的引言和摘要做一个总结分类。对差分隐私的方向有一个大概的了解。关于这一点一定要自己去做,看别人的博客没有自己总原创 2021-11-12 17:09:21 · 3253 阅读 · 1 评论 -
基于随机响应机制的本地差分隐私【谷歌】论文笔记
RAPPOR: Randomized Aggregatable Privacy-Preserving Ordinal Response 论文阅读写在前面的话自己的理解(整理)攻击模型注意事项相关工作总结写在前面的话这篇文章是我在读《AsgLDP: Collecting and Generating DecentralizedAttributed Graphs With Local Differential Privacy》时用到的一篇引文。来自谷歌作者团队,收录于14年的CCS。时间比较久远,但是很经原创 2021-11-10 19:26:02 · 2303 阅读 · 0 评论 -
图合成与差分隐私(图结构和节点属性)论文笔记
AsgLDP: Collecting and Generating DecentralizedAttributed Graphs With Local Differential Privacy 论文笔记写在前面的话前置知识属性图本地差分隐私LDP我的理解摘要引言相关工作生成图模型差分隐私图生成模型一般LDP应用程序LDP对分散的属性图的看法总结Attributed Graphs With Local Differential Privacy 论文笔记)写在前面的话在上一周看了两篇社交图与差分隐私的论原创 2021-11-09 11:35:51 · 1301 阅读 · 0 评论 -
差分隐私中随机响应的抛硬币问题(LDP)
[关于随机响应的抛硬币问题和LDP的思考] RAPPOR: Randomized Aggregatable Privacy-Preserving Ordinal Response 【论文笔记】 写在前面的话摘要RAPPOR和(纵向)攻击结论直接看这里吧!!!!写在前面的话这篇论文是下面这篇论文的引文有一个地方没有弄明白之前看的是投两次硬币,这里写的是一次性的概率,如果p小于0.5那不就为负数了,得到的值还比原来的小。单是这一点我就很困惑,再者这个概率p和1-p不都是对于总体而言吗?可以单独放在一原创 2021-11-09 11:01:11 · 1874 阅读 · 0 评论 -
ELV局部视图与差分隐私【敏感度到底怎么理解】【下】
【后续】Analyzing Subgraph Statistics from Extended Local Views with Decentralized Differential Privacy写在前面的话二阶段框架多阶段框架在DDP下计算不同类型的子图三角模式计算一刀切方法写在前面的话之前的笔记写到多阶段框架就没写了,在组会前还有点时间把后面的内容完善一下。这个多阶段框架的关键如下:我们提出的框架直接解决了局部灵敏度不能满足差异隐私的根本问题:噪声尺度本身是私有信息。这个想法很简单:我们仍然原创 2021-11-06 22:02:23 · 586 阅读 · 0 评论 -
全局敏感度,局部敏感度和平滑敏感度到底有什么区别?【差分隐私】
全局敏感度,局部敏感度和平滑敏感度到底有什么区别?【踩坑笔记】写在前面的话噪声校准全局敏感度:局部敏感度平滑敏感度噪声分布范围自己的理解写在前面的话关于敏感度相关的知识,我认为这是差分隐私的重中之重。这也是我个人的笔记,如果又不正确的地方欢迎指正,谢谢大家。大家不想看长篇大论可以直接点目录里面(自己的理解)。噪声校准全局敏感度:全局敏感度度量在修改一个元组时查询结果的最大变化。它只与查询函数相关,并且独立于数据集本身。对于一些函数,如和、计数和最大值,全局灵敏度很容易计算。例如,计数的全局敏感原创 2021-11-05 16:27:34 · 7080 阅读 · 10 评论 -
基于图结构的图合成与差分隐私【LDPGen】
《Generating Synthetic Decentralized Social Graphs with Local Differential Privacy》 论文笔记写在前面的话摘要问题对策实验数据集指标介绍总结背景基线方法随机响应基于度的图像合成方法对比LDPGen一般框架思路问题:怎么分区?问题:怎么合成?具体步骤初始分组分组细化图形生成初始分组阶段设计写在前面的话这篇文章是我读了《Analyzing Subgraph Statistics from Extended Local Views原创 2021-11-05 10:58:26 · 15588 阅读 · 1 评论 -
ELV局部视图与差分隐私【敏感度到底怎么理解】【上】
《Analyzing Subgraph Statistics from Extended Local Views withDecentralized Differential Privacy》论文笔记写在前面的话前置知识敏感度邻接图ELVTwo-hop ELVNeighboring ELVLDP功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也原创 2021-11-02 15:04:40 · 1342 阅读 · 0 评论