隐私计算
文章平均质量分 82
nanoleak coding
这个作者很懒,什么都没留下…
展开
-
PipelineDP
概述深入了解 PipelineDP 的工作原理以及项目背后的一些基本设计决策。请注意,该项目仍处于试验阶段,可能会发生变化。目前我们不推荐在生产系统中使用它,因为它还没有经过彻底的测试。您可以在路线图部分了解更多信息。关键概念本页解释了文档、代码和示例中使用的关键定义。设计概述PipelineDP 设计可以在多个数据处理框架上执行(包括本地执行),并且可以扩展到其他框架。这可以通过以与框架无关的方式实现所有 DP 逻辑来实现,与框架执行数据处理的方式完全分离。这是它的详细工作..翻译 2022-05-29 21:01:08 · 266 阅读 · 0 评论 -
全同态加密 (FHE) 框架
同态加密密码系统是一种解密是态射的密码系统。Decrypt(a*b) = Decrypt(a) * Decrypt(b)同态加密密码系统允许在不解密的情况下对密文进行操作。它确保了端到端的语义安全,这确保了对诚实但好奇的对手的安全性。与机密计算不同,FHE 采用基于软件的数据加密/保护。由于 FHE 不在可信执行环境 (TEE) 中执行计算处理,因此在处理过程中可能会发生未经授权的访问或修改数据和应用程序代码。因此,FHE 不支持应用程序代码完整性和代码机密性。同态加密密码系统解决了带错翻译 2022-05-29 20:42:37 · 4043 阅读 · 0 评论 -
远程数据科学:第 1 部分 - 当今大数据中的隐私挑战
远程数据科学:第 1 部分 - 当今大数据中的隐私挑战翻译 2022-05-28 22:10:16 · 384 阅读 · 0 评论 -
什么是零知识证明?
这篇文章是我们的“隐私保护数据科学”系列的一部分。随着人工智能领域的发展,我们的经济越来越以数据为驱动力。组织可以大量收集我们的数据,以便利用数据点之间保存的信息。因此,随着组织参与技术生态系统的发展,组织在存储您的数字足迹方面存在着不断增长的经济动力。监视资本家可能会使用此数据来了解使我们打勾的原因,并通过有针对性的在线广告产生收入。尽管这是相对无害的,但是自从那时以来,该技术已被应用到比零售更阴险的领域。在过去的十年中,使用了这些可扩展的大众说服工具,以破坏民主,甚至煽动暴力。随着这些工具监视的翻译 2020-10-12 11:57:01 · 495 阅读 · 0 评论 -
从零开始学习加密高斯朴素贝叶斯
朴素贝叶斯:基于贝叶斯定理,朴素贝叶斯方法是用于分类的概率模型。当数据集的维数很高时,它们非常有用。贝叶斯定理:P(A|B)=P(B|A)*P(一)P(B)使用贝叶斯定理,假设事件B已经发生,我们可以找到事件A发生的概率。在这里,我们认为事件A和事件B是彼此独立的“天真”假设。对于我们考虑的所有特征向量均保持该假设。因此,要计算给定变量y的概率,我们将得到特征向量x1至xn,则贝叶斯定理可以应用为:P(y|X1个,X2,。。,X...翻译 2020-07-08 09:46:59 · 330 阅读 · 0 评论 -
联邦学习-隐私保护数据科学解释 PRIVACY-PRESERVING DATA SCIENCE, EXPLAINED
我们今天要用数据科学解决的许多问题都需要访问敏感的个人信息-无论是我们的病史,财务记录还是个人习惯。每天,像您和我这样的人都会在我们的智能手机,电子设备或医疗设备上生成大量数据。但是由于隐私或专有方面的考虑,用于解决有意义的问题的数据可能会很有限且难以访问。我们可以在不侵犯个人隐私的情况下进行数据科学吗?如果是这样,我们可以结合哪些技术使其成为可能?传统上,训练模型将需要将此数据传输到中央服务器,但这引起了对数据隐私和安全性的众多担忧。数据泄漏和滥用造成的风险已导致世界各地立法制定数据保护法。为了在翻译 2020-05-26 16:11:25 · 1623 阅读 · 1 评论 -
什么是联邦学习
在有关私有ML的入门系列文章中,我们将介绍联邦学习(FL),解释什么是FL,何时使用它以及如何使用OpenMined工具实现它。本文中的信息将为广泛的读者所理解,但逐节地,我们将深入研究和理解联邦学习。有关该系列的更多信息,请查看介绍性文章或查看其他文章,以了解更多有关可通过OpenMined的库启用隐私保护ML的技术的信息。介绍联邦学习最初于2015年提出,它是一种算法解决方案,可通过将模型的副本发送到数据驻留的地方并在边缘进行训练来训练ML模型,从而消除了将大量数据移到中央的必要性服务器用于翻译 2020-05-25 16:01:59 · 3816 阅读 · 0 评论 -
基于spark实现的全同态数据计算框架sparkfhe实现思路
Follow the SparkFHE project at https://github.com/SpiRITlab or http://sparkfhe.slack.comTry it out at https://github.com/SpiRITlab/SparkFHE-Examples/wiki翻译 2020-05-20 17:55:51 · 527 阅读 · 0 评论 -
MAINTAINING PRIVACY IN MEDICAL DATA WITH DIFFERENTIAL PRIVACY(通过差分隐私维护医疗数据的隐私)
通过差分隐私维护医疗数据的隐私想象一下,您在一家医院担任DL研究人员,而您的工作是寻找帮助医生抗击疾病的方法。由于冠状病毒(无形的敌人)大流行,越来越多的患者和大量CT影像等待被诊断。您决定创建一个图像分类器,这不仅可以减轻临床医生的负担,并帮助他们做出更明智的决定,还可以加快诊断速度并可能挽救生命。但是,这是一个挑战。您的CT图像未标记。 引起您注意的是,其他5家医院都对CT扫描进行了注释(对于COVID 19,“阳性”或“阴性”),这正是您所需要的。尽管这些医院愿意提供帮助,但它们在共享患者信息方.翻译 2020-05-19 09:42:45 · 1179 阅读 · 0 评论 -
公钥可搜索加密-双线性对
我们将大数据存储在云服务器上,为了保护数据隐私,通常会选择先将数据加密后再上传。可搜索加密(Searchable Encryption)研究如何在密文上进行关键字搜索,分为对称可搜索加密(Searchable Symmetric Encryption)和公钥可搜索加密(Public-key Encryption with Keyword Search,PEKS)。 虽然对称可搜索加密比较快,但在多用户数据共享方面,公钥可搜索加密的应用场景比对称可搜索加密更为广阔。双线性对(Bilinea...转载 2020-05-13 15:40:17 · 2729 阅读 · 5 评论 -
翻译--ASYNCHRONOUS FEDERATED LEARNING IN PYSYFT(PYSYFT中的异步联邦学习)
在这篇文章中,我们提供了使用PySyft应用联邦学习的展示。PySyft是一个开源python库,用于从OpenMined社区进行安全和私有的深度学习。它将私人数据与模型训练分离。在联邦学习中,每个边缘设备都处理自己的数据以进行训练,避免将其发送给另一个实体,从而保护了隐私。此外,训练阶段的主要处理工作是在设备上完成的,因此与在数据中心进行训练相比,减少了必要的带宽和数据处理。所有设备都可以通过组合其AI模型相互学习,这可以由可以放置在云中或边缘的中央协调节点完成。由于从设备发出的信息是最终的AI模型更翻译 2020-05-10 23:58:56 · 1277 阅读 · 1 评论 -
翻译--USE CASES OF DIFFERENTIAL PRIVACY(差分隐私用例)
在此博客文章中,我们将介绍从生物医学数据集分析到地理位置定位的差分隐私(DP)的一些用例。有关为SG OpenMined Explorers研究组创建的与该帖子相关的幻灯片,请参阅@Ria的“差分性隐私和联邦学习用例”。让我们从将差分隐私应用于基因组学开始。基因组学机器学习对基因组学应用具有重要意义,例如对于精密医学(即针对患者的临床/遗传特征进行定制的治疗)1以及检测从不同人群中收集的数据中的细微见解2。鉴于快速创建了许多基因组数据集以促进这些应用程序的统计分析和机器学习研究,此类应用程.翻译 2020-05-10 23:06:08 · 840 阅读 · 0 评论 -
翻译-TOWARDS PRIVACY WITH RSTUDIO: ENCRYPTED DEEP LEARNING WITH SYFT AND KERAS
注意:这篇文章首先出现在RStudio AI博客(以前是RStudio TensorFlow博客)上,致力于R的所有深度学习,概率建模和分布式计算。假定原始读者熟悉R包tensorflow和keras,旨在允许以惯用的,类似于R的方式设计和训练TensorFlow / Keras模型,以及网状结构(这种巧妙的助手),它使我们能够将Python功能直接集成到R中。简而言之深度学习不必与隐私保护保持一致。联邦学习可实现设备上的分布式模型训练;加密使模型和渐变更新不公开;差分隐私可防止训练数据泄漏。到目前为止翻译 2020-05-10 22:46:19 · 972 阅读 · 0 评论 -
找一个差分隐私sql封装,相关论文和实现简单调研
最开始想找基于spark实现的差分隐私框架,找到了Shade: A Differentially Private Wrapper Around Apache Spark 这篇论文https://dspace.mit.edu/bitstream/handle/1721.1/119522/1066694305-MIT.pdf?sequence=1&isAllowed=y实现架构:这个框架的代码找不到开源的看到里面介绍了微软的PINQ/wPINQ,是LINQ的扩展以及A..原创 2020-05-09 20:11:28 · 653 阅读 · 5 评论 -
使用pysyft发送模型给带数据集的远端WebsocketServerWorker作联合训练
WebsocketServerWorker端代码:start_worker.pyimport argparseimport torch as thfrom syft.workers.websocket_server import WebsocketServerWorkerimport syft as sy# Argumentsparser = argparse.ArgumentParser(description="Run websocket server worker.")parser原创 2020-05-09 17:23:14 · 1377 阅读 · 2 评论 -
翻译--A PRIVACY-PRESERVING WAY TO FIND THE INTERSECTION OF TWO DATASETS 在保护隐私的前提下找两个数据集的交集--隐私数据集求交
隐私数据集交集(PSI)是一种强大的加密技术,它允许两方计算其数据的交集,而无需将其原始数据暴露给另一方。换句话说,PSI允许测试各方是否共享一个公共数据点(例如位置,ID等)。在这篇文章中,我们介绍:1、PSI的解释2、PSI如何在COVID-19危机技术中发挥作用3、技术细节:如何实现以及在实际情况下如何工作基本概念如果您没有密码学背景,请不要担心!我们将以一些基础知识和常见术语的介绍开始,以使您熟悉该语言。最好将密码学描述为秘密通信的研究领域。当一方希望与另一方共享消息同时在数学上确保任翻译 2020-05-09 11:28:26 · 1383 阅读 · 0 评论 -
转载-联邦学习 - 基础知识+白皮书+杨强教授讲座总结+同态加密+ 差分隐私
原文链接:https://blog.csdn.net/qq_41409438/article/details/102213895联邦学习兴起原因概念分类横向联邦学习纵向联邦学习联邦迁移学习优势系统架构联邦学习与现有研究的区别联邦学习与差分隐私理论的区别联邦学习与分布式机器学习的区别联邦学习与联邦数据库的关系联邦学习的最新发展及应用 (2019第四届全球人工智能与机器人...转载 2020-05-08 16:28:45 · 1258 阅读 · 0 评论 -
TEE下的加密深度学习:PySyft pytorch Intel SGX 关于受信任执行环境的安全聚合
The world now creates more digital data than we could ever imagine — more than 90% of all existing data has been generated in the last decade. The field of artificial intelligence has tapped into the ...翻译 2020-04-17 21:48:47 · 1995 阅读 · 1 评论 -
pygrid:用于私有数据科学和联邦学习的p2p平台
如果您可以训练世界上所有数据,而又不会将这些数据留给设备,同时又将这些数据保密,该怎么办? PyGrid是用于私有数据科学和联合学习的对等平台。借助PyGrid,数据所有者可以提供,监视和管理对自己私有数据集群的访问。数据不会离开数据所有者的服务器。 然后,数据科学家可以使用PyGrid对私有数据集进行私有统计分析,甚至可以跨多个机构的数据集进行联合学习。 该博客...翻译 2020-05-08 09:47:03 · 1240 阅读 · 0 评论 -
通过联合学习PySyft和Pygrid来预测涡轮风扇发动机的维护
无需直接访问数据就能从机器学习的奇迹中受益吗?如今,机器学习可用于准确预测和预防发动机故障。但是,如果不允许访问传感器数据,如何防止昂贵,重要的机械故障呢?机器学习在行业中变得越来越重要,例如通常用于降低成本和提高效率,或者专门用于预测性维护。预测性维护是确定设备状况的一种做法,以便估计何时应该执行维护-不仅可以预防灾难性故障,还可以避免不必要的维护,从而节省了时间和金钱。但是在许多情况下...翻译 2020-04-18 20:57:23 · 1389 阅读 · 0 评论 -
pygrid教程3--本地部署pygrid 网络
https://github.com/OpenMined/PyGrid/blob/dev/examples/Part%202%20-%20Launch%20a%20PyGrid%20Network%20Locally.ipynb在本地启动网格网络在本教程中,您将学习如何将网格网络部署到本地计算机,然后使用PySyft与之交互。警告:网格节点在线发布数据集,仅供实验使用。部署节点需要您自担...翻译 2020-05-03 21:01:20 · 829 阅读 · 0 评论 -
在android上实现联邦学习--迁移学习方式
Implementation of federated learning on Android前言时隔一年之久再次更新博文。????记录近来的项目经历,留作以后参考,也希望能够帮到有需要的人。本项目的需求如下:搭建实际的联合学习(Federated Learning)场景,主要包括两个组成部分:服务器与客户端。两者的角色分别是:服务器:集中处理由客户端上传的更新后的机器学习模型之权重,并...转载 2020-05-07 22:08:21 · 1868 阅读 · 0 评论 -
区块链与机器学习整合随想
使用waterdrop 对接mpcsql模型直接给出结果部署到区块链,服务bi或者区块链浏览器。使用waterdrop 对接训练联邦模型过程,把训练模型部署到区块链,服务预测服务或者用于买卖。启发于,机器学习训练过程其实和etl很相似,transform连接。这种模式比较偏预言机场景,只是对结果和模型进行了简单验证,依赖外部各方的可信信任进一步实现区块链上全局信任,需要使用更严格的验证模型,...原创 2020-05-07 18:04:46 · 1074 阅读 · 0 评论 -
SMCQL 、 ObliVM 与 conclave 多方安全计算框架调研
1、SMCQLSMCQL将SQL语句转换为ObliVM程序,以进行安全的查询。相关介绍:https://inst.eecs.berkeley.edu/~cs294-163/fa19/slides/SMCQL.pdf代码仓库:https://github.com/smcql/smcql/论文:http://www.vldb.org/pvldb/vol10/p673-roger...原创 2020-05-03 20:24:54 · 1944 阅读 · 0 评论 -
pygrid教程2--本地部署pygrid 节点
第1部分:本地启动网格节点在本教程中,您将学习如何将网格节点部署到本地计算机,然后使用PySyft与之交互。警告:网格节点在线发布数据集,仅供实验使用。部署节点需要您自担风险。不要将OpenGrid与您希望保持私有的任何数据/模型一起使用。为了在本地运行节点,您需要做的就是运行一个应用程序,然后开始通过Grid Worker与之通信。在本教程中,我们将使用websocket应用程序第1...翻译 2020-04-28 21:36:22 · 802 阅读 · 2 评论 -
pygrid教程1--pygrid介绍
什么是PyGrid?PyGrid(也称为Grid)是一个面向数据所有者和数据科学家的协作网络平台,他们可以使用PySyft库集体训练和共享AI模型,该库扩展了PyTorch和Tensorflow等深度学习库。介绍内容包括1、介绍2、目标3、实作介绍PyGrid平台旨在成为用于训练,管理和共享模型的安全对等平台。网格是可以透明地交换消息和张量的工作人员的集合。GRI...翻译 2020-04-25 22:53:45 · 1789 阅读 · 0 评论 -
在大数据工作流中集成安全多方计算
原文ppthttp://www.bu.edu/macs/files/2016/09/Volgushev-MPC.pdf...翻译 2020-04-25 21:46:15 · 218 阅读 · 0 评论