洞见科技王湾湾：隐私计算可信安全实践 | 金融科技慕课学院第八期_隐私计算技术,是指在保证数据方不泄漏隐私数据的前提下,对数据进行计算并能验证计-CSDN博客

8月4日，由北京金融科技产业联盟与中国银联联合推出的线上直播栏目“金融科技慕课学院”第八期开播。在本期直播中，来自深圳市洞见智慧科技有限公司数据智能总监王湾湾以《隐私计算可信安全实践》为主题，介绍隐私计算面临的可信安全方面的问题及解决方案，包括无第三方的联邦学习、区块链如何增信隐私计算等。

隐私计算的发展历程及应用现状

隐私计算，全称隐私保护计算(Privacy-Preserving Computation)，是指在提供隐私保护的前提下，实现数据价值挖掘的技术体系。面对数据计算的参与方或其他意图窃取信息的攻击者，隐私保护计算技术能够实现数据处于加密状态或非透明状态下的计算，以达到各参与方隐私保护的目的。隐私计算是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系，它能够保证在数据隐私安全的基础上，实现数据“价值”的流动与共享，真正做到“数据可用不可见”。

目前，隐私计算技术主要分为三大流派，一是可信执行环境，它是通过CPU专属区域为数据和代码执行提供一个更安全的空间，目前有代表性的包括Intel SGX、ARM Trustzone。

二是安全多方计算，它是指在无可信第三方的情况下，通过多方共同参与，安全地完成某种协同计算，包括不经意传输、混淆电路、秘密共享等技术。安全多方计算在1980年代即被提出，但彼时尚处于理论发展阶段；直至2008年，安全多方计算才被大规模实际应用，应用场景是丹麦的某次拍卖会，这标志着安全多方计算从理论研究阶段走向现实应用阶段。近年来，随着人工智能和大数据的发展，安全多方计算的应用场景也在不断扩大。

三是联邦学习，它旨在建立一个基于分布数据集的联邦学习模型，是一种多个参与方在各自的原始私有数据不出私域的前提下，协作完成某项机器学习任务的机器学习模式。

2016年，谷歌在发表于arXiv上的论文里首次提出联邦学习的概念。2018年，杨强教授将横向联邦学习的概念推广到纵向联邦学习和迁移联邦学习。

另外，在研究隐私保护和机器学习的关联时，发现1995年第一届KDD会议上提出隐私保护数据挖掘(PPDM)的概念，2002年已经出现隐私保护和机器学习相结合的论文，2018年NeurIPS举办了首个PPML研讨会。可见，隐私保护角度下的机器学习很早之前就受到关注。

隐私计算技术在不同的行业领域均有应用。以金融行业为例，银行、保险等机构在服务客户的流程中，在多个环节都引入了外部数据来提升决策的高效性和精准性。隐私计算为金融机构间，甚至跨行业的数据合作、共享提供了可能。目前在精准营销、风险信息共享、信贷风险评估、反欺诈、反洗钱、保险定价等方面，金融机构都已经开始开展隐私计算研究与试点。

在政务方面，因涉及个人信息保护等问题，以统计形式为主的信息公开使得政务数据可用性大大减弱。借助隐私计算，可以实现隐私保护下的高质量数据协作。目前，地方政府部门已经开始通过隐私计算平台达成政务和企业的数据协作，实现政企数据融合应用。

在医疗行业，病人隐私和数据保护要求制约了AI技术在医疗领域的发展和应用。为了解决这个问题，医疗机构已经开始采用基于隐私计算的数据合作方案，多个医疗机构在不共享原始数据的前提下，开展联合建模和联合数据分析，以隐私计算助力医学影像识别、疾病筛查、AI辅助诊疗等。

隐私计算应用中的可信安全问题

在与客户交流时，数据源机构、银行/保险机构经常会提出一些关于隐私计算可信安全方面的问题。包括：如何验证隐私计算协议本身是安全的，如何防止数据泄漏；如何验证隐私计算的实现与声明的计算协议是一致的，如何验证交互的数据未包含敏感信息且无法推测出原始数据；隐私计算需要参与方之间的多轮通信，在这期间如何保障通信信道安全；在有第三方的架构中，如何防止第三方被攻击或与其他方共谋；如何防止参与方进行数据投毒、模型投毒；如何保证隐私计算的结果数据未泄漏敏感信息等等。

针对这些问题，首先要了解在隐私计算可信安全的概念中，包括哪些安全性要素及其所包含的整体范围。隐私计算的可信安全是指原始数据在存储、流转、处理中的安全性，在理想情况下，利用隐私计算技术参与计算时，参与方只能获得其参与计算所必需的数据和协议规定的计算结果，不应获得其他任何信息。一个良好的隐私计算系统可以从计算安全、数据安全、通信安全、系统安全、应用安全等多个方面考量其隐私安全性。

安全多方计算在隐私计算过程安全性上是有严格的定义的，包括四个方面的安全属性。一是隐私性，即各参与方除自身输入的原始数据以及既定函数计算输出结果外，无法获得其他任何信息。二是正确性，即如果各参与方均遵守计算协议完成计算，那么参与方应该收到正确输出结果。三是公平性，即如果恶意参与方获得计算输出结果，其前提是诚实参与方都已获得计算输出结果。四是保证输出，即诚实参与方可以确保收到正确的计算结果。

安全多方计算协议在设计之时，需要假定其满足什么样的安全行为模型。具体包括：半诚实敌手模型，即各参与方严格遵循协议的要求，执行协议要求的各项步骤，但是会尽可能从获得的数据中挖掘其他参与方的隐私；恶意敌手模型，即恶意参与方试图通过改变协议，甚至采取任意行为获取其他参与方的隐私；隐蔽敌手模型，即恶意参与方在试图破坏协议执行时，攻击行为将有一定概率被检测到，并受到相应的处罚。

在理论层面，联邦学习的安全性并没有严格的定义，其安全性重点关注于交互数据能否实现对参与方原始数据和隐私信息的推断。但是截至目前，大量针对联邦学习的安全性分析工作也已经在开展，更多的是从攻防的角度来判断是否是安全的。

洞见科技建立了基于技术信任的隐私数据安全保护体系(SAAAAS)。洞见科技INSIGHTONE平台除了采用安全多方计算和联邦学习来保证数据计算协议层的安全性。它还具备完整的数据使用授权流程、存证审计流程以及严格的访问权限控制和健全的身份鉴定体系。基于该技术体系，可保证隐私数据在整个计算过程中的安全性。

无第三方的联邦学习(NTP-FL)

在了解无第三方联邦学习之前，首先来了解“有第三方联邦学习”的架构。

针对第三方信任问题，洞见科技研究了很多无第三方的联邦学习方案，从技术思路上归结于两种类型，一是本地明文计算与同态加密/MPC多方联合计算相结合，二是在MPC基础算子和函数算子之上协同机器学习。

有、无第三方的联邦学习方案各有其优劣势，适用场景也有所差别。在有第三方的方案中，数据提供方之间可不建立通信，第三方与所有参与方建立通信，但其存在着第三方与其他方合谋，从而导致数据泄漏的风险，因此，这种方案适用于带监管性质的机构作为可信第三方的场景下。无第三方的方案则不存在第三方信任风险问题，但其需参与方之间两两建立通信，在参与方只有两方时非常适用，但在参与方为三方及以上时，商业应用协调成本高，因此，这种方案适用于无合适的机构作为可信第三方的场景下。

区块链增信隐私计算

隐私计算的核心功能是围绕着数据隐私的保护。将一个隐私计算的任务进行抽象化处理，可以呈现出一个包括输入、计算和输出的过程。

由于隐私计算底层原理一般涉及密码学，比较复杂，大众很难直接产生信任，比如他们会质疑如何证明没有发送原始数据，如何证明构建的模型是有效的，如何证明数据的贡献度是可信的，如何证明系统没有后门，如何证明计算结果是可信的，技术上是否有可能将原始数据导出，是否可能发生多方共谋导致隐私泄露等。若要让大众对隐私计算产生信任，则需要建立起有效的信任机制。

区块链技术为隐私计算带来更多信任，区块链的发展是在建立在加密技术、分布式网络技术上的，它经历了数字货币1.0时代、智能合约2.0时代，现正在进入大规模应用3.0时代。

区块链技术为隐私计算带来的安全性保证主要基于数据的可信和计算的可信两个角度。数据的可信主要对应的是区块链的存储功能，计算的可信对应的则是区块链的智能合约。

隐私计算保证了数据隐私的安全，区块链技术则被期望重构数字世界的信任体系，两者结合起来将共同以技术信任链接服务、数据与智能的孤岛，形成互联互通的新秩序。

隐私计算未来发展方向及挑战

除了在安全可信方面的挑战之外，隐私计算还面临着性能瓶颈和互联互通壁垒。性能瓶颈制约隐私计算大规模落地应用，目前正在通过算法优化和硬件加速等来改善，比如优化算法流程设计，降低通信次数及通信量，优化加密计算效率，也可以结合硬件加速技术(如GPU、FPGA、ASIC加速)实现特定算法来实现硬件加速计算。平台互联互通壁垒阻碍了隐私计算助力数据流通，目前行业内通过建立互联互通标准和增强互联互通实践来应对，比如北京金融科技产业联盟、中国信通院等多家组织机构正在通过建立标准或测评来积极推动互联互通建设，而越来越多的厂商之间也在推进平台之间的互通，洞见科技在技术侧已与蚂蚁、锘崴等多家机构实现管理系统、算法协议两个层次的互通，正在朝着第三层次“计算原语互联互通”的方向迈进，在业务侧也与多家金融机构涉及互联互通上的合作。

国家政策给隐私计算的发展带来利好，与数据要素相关的法规、政策的出台促进了数据的流通应用，数据安全和隐私保护的法规、政策的出台也对数据应用提出了安全要求。比如中共中央、国务院已明确将数据作为新型生产要素，与土地、劳动力、资本、技术等要素并列，数据要素按贡献参与分配，推进要素市场制度建设，而《中华人民共和国密码法》、《中华人民共和国网络安全法》、《信息安全技术个人信息安全规范》、《数据安全法》的相继出台，里程碑式地明确了企业在收集、使用、保存非公开隐私数据时所需要达到的技术效果。

目前，从国家政策和法律层面而言，无论是隐私计算技术，还是人工智能、区块链等技术，均未从整体上对技术的合法性作出判断，但这并不妨碍期待更细化的行业监管方法或法规陆续出台，对隐私计算技术在数据流通应用中的落地提供指引，而在不同的行业领域，同样期待监管机构能够提供监管方法的指引或参考案例，共同推动行业良性发展。