基于同态加密和秘密分享的纵向联邦 LR 协议研究

最新推荐文章于 2023-03-03 11:56:33 发布

开放隐私计算

最新推荐文章于 2023-03-03 11:56:33 发布

阅读量356

点赞数

文章标签：同态加密机器学习区块链

原文链接：https://mp.weixin.qq.com/s/3mucxzha4upWjIBZclU7zw

版权

论文引用格式：

符芳诚, 刘舒, 程勇, 等. 基于同态加密和秘密分享的纵向联邦 LR 协议研究[J]. 信息通信技术与政策, 2022,48(5):34-44.

基于同态加密和秘密分享的纵向联邦 LR 协议研究

符芳诚1,2 刘舒2 程勇2 陶阳宇3

（1. 北京大学信息科学技术学院高可信软件技术重点实验室，北京 100871；2. 腾讯TEG数据平台部，深圳 518054；3. 腾讯TEG机器学习平台部，北京 100083）

摘要：提出了一种新颖的两方纵向联邦逻辑回归协议，并在半诚实安全模型下证明了该协议的安全性，包括模型训练流程和模型推理流程的安全性，且无需对非线性函数使用多项式近似计算，从而保证了联邦逻辑回归协议模型无损。

关键词：纵向联邦学习；逻辑回归；同态加密；秘密分享

中图分类号：TP309.2 文献标志码：A

引用格式：符芳诚, 刘舒, 程勇, 等. 基于同态加密和秘密分享的纵向联邦 LR 协议研究[J]. 信息通信技术与政策, 2022,48(5):34-44.

DOI：10.12267/j.issn.2096-5931.2022.05.005

引言

机器学习和人工智能已经在多个领域取得了巨大的成功，如图像识别、自然语言处理、广告推荐等。在人工智能技术突飞猛进的同时，潜在的用户数据滥用和隐私泄露风险也逐渐成为业界广泛关注的焦点。出于数据安全和隐私保护的考虑，不同机构所拥有的数据无法被整合集中在一起用于机器学习建模，导致了数据孤岛问题的出现，进而阻碍了人工智能应用的发展。近年来，如何在保证每个机构的数据安全和用户隐私的前提下，协同多个机构的数据进行联合机器学习建模，从而提高模型的表达能力、更深入地释放数据价值，成为了学术界与工业界广泛研究的热点课题[1-2]。

联邦学习（Federated Learning，FL）[3]是由谷歌于2016年提出的概念，旨在解决如何在数据不出本地的情况下，联合多个参与方（如智能手机等终端设备）中的数据进行模型训练。依据参与方不同的数据划分形式，联邦学习被进一步细分为横向联邦学习（Horizontal FL）、纵向联邦学习（Vertical FL）和联邦迁移学习三种范式[4]。本文关注的是纵向联邦学习场景。如图1所示，在纵向联邦学习中，不同的参与方拥有不同的特征空间，但在样本空间上存在交集；该交集部分可以被视作一个虚拟的纵向划分的数据集（即虚拟宽表），用于联合的数据建模与分析。此外，在纵向联邦学习中，只有一个参与方拥有标签信息（Label），称该参与方为参与方B，并称没有标签信息的参与方为参与方A。针对最常用的机器学习算法协议之一，本文围绕两方纵向联邦学习场景下的逻辑回归（Logistic Regression，LR）协议[5-7]，着重分析如何设计一个安全的纵向联邦LR协议，并结合同态加密和秘密分享两种技术，提出了一种安全的联邦LR协议。在半诚实安全模型下，证明了所设计的纵向联邦LR协议的安全性。该纵向联邦LR协议已部署于通用隐私计算平台Angel PowerFL中，并获得了广泛的应用落地。

本文对纵向联邦LR算法协议的安全性进行了全面的分析，并详细列出了保证特征数据和标签信息安全的具体要求。基于该分析，提出了一种新颖的两方纵向联邦LR协议，该协议通过结合同态加密和秘密分享技术来保证特征数据和标签信息的安全，且无需对非线性函数使用多项式近似计算，从而可以保证联邦LR模型无损。笔者在半诚实安全模型下证明了该协议的安全性，包括模型训练和模型推理流程的安全性。本文所提出的联邦LR协议的交互流程简单，易于工程实现，且计算和通信开销都较小，已经在通用隐私计算平台Angel PowerFL中获得了广泛的应用和经过了充分的检验。

开放隐私计算

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于同态加密和秘密分享的纵向联邦 LR 协议研究

针对最常用的机器学习算法协议之一，本文围绕两方纵向联邦学习场景下的逻辑回归（Logistic Regression，LR）协议[5-7]，着重分析如何设计一个安全的纵向联邦LR协议，并结合同态加密和秘密分享两种技术，提出了一种安全的联邦LR协议。在半诚实安全模型下，证明了所设计的纵向联邦LR协议的安全性。提出了一种新颖的两方纵向联邦逻辑回归协议，并在半诚实安全模型下证明了该协议的安全性，包括模型训练流程和模型推理流程的安全性，且无需对非线性函数使用多项式近似计算，从而保证了联邦逻辑回归协议模型无损。...
复制链接

扫一扫