隐私计算基本介绍

隐私计算的基本概念

隐私计算的起源

百万富翁问题:两个百万富翁街头邂逅,他们都想炫一下富,比比谁更有钱。但是出于隐私,双方都不想让对方知道自己到底拥有多少财富。如何在不借助第三方的情况下,让两位富翁知道他们之间谁更有钱?

由此引申到现在,隐私计算解决的问题就是“一组互不信任的参与方在需要保护隐私信息以及没有可信第三方的前提下进行协同计算的问题”。

隐私计算的定义

隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行加密、分析计算的一系列信息技术, 由加密数据进行交互计算,其他参与方无法获知原文数据,保障数据在多方之间流通与融合过程中的“可用不可见”。

多方之间要实现数据的互换,但是不希望自己的隐私数据泄露,但又希望可以通过其他多方获得想要的数据,在隐私计算的世界里,多方在本地部署隐私计算节点,所有的原文数据处理都在本地,进行加密后将密文和其他参与方进行通讯交互,由多方的隐私计算节点联合对密文进行计算后,由算法返回各方所需的数据结果,所有出域的数据都是密文,保证所有的明文数据都在本地不出域,防止敏感数据的泄露。

隐私计算的特性

输入隐私性

根据隐私计算节点的计算任务,从本地查询数据,再进行数据计算,整个过程中,数据都在本地数据库中保存,不存在数据泄露问题,因此保证了输入数据的隐私性。

计算正确性

数据参与方根据约定进行任务计算,通过 隐私计算协议进行计算数据的查询、协同计算,因此可以保证计算的正确性。

去中心化

隐私计算不存在有特权的参与方或可信第三方,而是采用协议的方式代替第三方,通过协议保证各数据参与方地位权力平等,任何数据拥有者都可开启计算任务。

隐私计算的应用场景 

数据可信交换

隐私计算为不同机构间提供了一套构建在协同计算网络中的信息索引、查询、交换和数据跟踪的统一标准,可实现机构间数据的可信互联互通,为数据拥有方和需求方提供有效的对接渠道。

数据安全查询

隐私计算保证数据查询方仅得到查询结果,但对数据库其他记录信息不可知。同时,拥有数据库的一方,不知道用户具体的查询请求。

联合数据分析

随着社会活动中产生和搜集的数据和信息量急剧增加,敏感信息数据的收集、跨机构的合作以及跨国公司的经营运作等给传统数据分析算法提出了新的挑战,隐私计算通过其独有的算法保证数据流通中的安全性,实现联合数据分析。

隐私计算技术介绍

隐私计算是一个大的框架,里面包含多种算法以及硬件环境:多方安全计算(MPC),联邦学习、TEE。

多方安全计算

多方安全计算包含多种算法,如不经意传输、零知识证明、同态加密、隐私集合求交等。

通过P2P通讯,各隐私计算节点既是客户端也是服务端,所有数据在本地加密后传输,收到其他方的数据也是密文,计算节点对密文进行计算后再发送给其他节点。通过这样的算法实现原文数据不出本地的前提,实现多方数据交互计算,获得所需的数据结果。

下面以隐私集合求交算法进行初步解释:

隐私集合求交

假设参与的两方分别表示为 P0拥有集合X = {x0,..., xm−1},P1拥有集合Y = {y0,..., yn−1},他们想要联合求出 Z = X ∩Y 。为了方便后续介绍,我们假设两方的集合数据量相同。如果没有特别说明,我们默认m=n,并用m、n来表示两个待求交集合的大小。下面介绍ECDH-PSI的步骤:
1.双方协商ECC曲线相关参数,包括:共同选择一条ECC曲线、确定生成元G和p;
2.双方各自在有限域Fp范围内随机选择一个参数和;
3.P0计算X中每个元素和的点乘,标记该集合为X’发送给P1;
4.P1计算Y中每个元素和的点乘,标记该集合为Y’,以及接收到的X’和的点乘,标记为X’’。发送这两个集合给P0;
5.P0从Y’中抽取每个元素计算和的点乘,如果计算后的结果在X’’中,则将该元素加入交集中。

联邦学习

联邦学习分为横向联邦学习、纵向联邦学习、联邦迁移学习。

由于机器学习模型的训练需要大量的精准数据,但是由于单独一方拥有的数据量是有限的。而多方之间共享数据来优化模型,又会存在数据泄露的风险。因此如何在保证数据不被泄露的情况下,实现多方数据交互,完成机器学习模型的优化,成为了联邦学习的关键。

联邦学习不需要参与方把数据传输到中心模型上运算,而是在本地训练好一个小模型后,把训练后的模型和其他方训练好的模型传给系统平台做整合调试,以此达到优化目的。这种方法既实现数据不出本地,又完成了联合计算和建模的目的。

横向联邦学习

横向联邦学习的场景是在多方的数据集拥有较多相同的特征,但是样本重合较少的情况。

纵向联邦学习

纵向联邦学习适用于样本重合较多,但是特征重合较少的数据集间联合计算。

联邦迁移学习

联邦迁移学习是数据集样本和特征重合都较少的场景。

TEE

TEE是在硬件上实现数据保护,通过软硬件方法在中央处理器中隔离一个可信的安全环境,数据计算在这个安全环境中进行,保证该安全环境中加载的程序机密性和完整性。也就是说可信执行控制单元已被预置集成到商用CPU计算芯片。

同时为了保证数据传输到TEE环境过程的安全性,TEE常结合密码学算法实现加密和验证。TEE可以和安全多方计算、联邦学习相结合,完成联合统计、联合查询、联合建模、预测等各种安全计算。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奔跑的白鸥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值