目录
摘要
在国家个人信息保护要求和数据要素高效流通的时代背景下,隐私计算技术作为解决个人信息保护与数据流通问题的关键技术之一受到广泛关注,隐私计算技术的标准化也已成为个人信息保护领域的重要研究课题。围绕隐私计算技术标准化路径进行分析,从标准化的现状、存在的问题、相关建议等方面进行了论述,旨在为隐私计算技术标准化建设提供参考。
关键词: 隐私计算; 标准化; 个人信息保护
0 引言
随着欧盟《一般数据保护条例》(General Data Protection Regulation,GDPR)的正式发布、生效,各国公民个人信息保护立法、执法的浪潮愈演愈烈。据联合国贸易和发展会议信息统计,截至2022年底,全球137个国家和地区已建立个人数据和隐私保护相关法律[1]。确保个人信息处理活动合法合规,是数据合理利用的首要前提。在此背景下,一些具有数据安全保护能力的算法和框架获得关注,并被统称为隐私计算技术。本文将对隐私计算技术框架进行梳理,分析国内外标准体系,针对标准化存在的问题给出相关建议。
1 隐私计算技术框架概述
隐私计算技术是指以隐私保护技术为基础,实现数据可用不可见、可控可计量的计算与分类技术[2-3]。根据隐私计算技术在系统中的层级,可分为应用层技术、算子层技术和环境层技术。
联邦学习[4-5]技术是隐私计算技术在应用层的典型代表,直接面向应用目标设计联邦学习算法,在不公开原始数据的情况下实现数据本地处理或分析,各参与方之间仅同步部分中间参数。相比于传统的中心化模型训练方式,联邦学习通过“去中心化数据汇聚”的方式对多方原始数据进行了隐私保护。
安全多方计算[6]技术是在数据分析之前采用转换数据计算的算法,以保证原始数据不被其他参与方了解。例如,用混淆电路方法将计算逻辑编译成电路,混淆执行。秘密分享则是将原始数据拆散发送,数据接收方只有拿到所有参与方的数据才能还原出原始数据。此外,安全多方计算在应用中会进行参与者论证,根据参与者诚实、半诚实、恶意等不同的安全假设来设计安全参数、算法以保证参与方数据安全。
可信执行环境[7]主要是指基于硬件方式来保证所有的数据流通和计算的安全性,是环境层技术的典型代表,如基于Intel芯片的软件保护扩展[8](Software Guard Extensions,SGX)和基于ARM开源框架的TrustZone[9]。SGX主要原理是将全部操作封装在飞地中,除CPU外,特权或非特权拥有者都无法进行访问。ARM TrustZone则是将一个