![](https://img-blog.csdnimg.cn/7ec328497ab1420fa1e9394fbcc53236.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
深入理解联邦学习
文章平均质量分 87
《深入理解联邦学习》系列以联邦学习为切入点,详细介绍了各类机器学习算法在横向联邦学习、纵向联邦学习和联邦迁移学习中的应用。除此之外,本系列还介绍了联邦学习常用框架以及现阶段的应用实例。
von Neumann
技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。
展开
-
深入理解联邦学习——隐私集合求交(Private Set Intersection,PSI):基础知识
使用纵向联邦学习,在甲公司和乙公司都不泄露各自的用户数据前提下,我们可以整合B和C两个用户的甲公司和乙公司数据特征,共同训练一个预测模型,由于使用到了两类数据进行训练,理论上来说得到的结果应该比甲公司或者乙公司各自训练出的模型更准确。如果参与双方需要求交集的数据本身,数据空间比较小,比如说手机号、身份证号等,那么对于一个恶意的参与方,就可以通过哈希碰撞的方式,在有限的时间内,碰撞出对方传过来的哈希值,从而窃取到额外的信息。在这里,额外的信息指的是除了双方的数据交集以外的任何信息。原创 2023-09-11 19:44:22 · 1192 阅读 · 0 评论 -
深入理解联邦学习——纵向联邦学习
在整个过程中参与方都不知道另一方的数据和特征,且训练结束后参与方只得到自己侧的模型参数,即半模型。[1] 杨强, 刘洋, 程勇, 康焱, 陈天健, 于涵. 联邦学习[M]. 电子工业出版社, 2020。[2] 微众银行, FedAI. 联邦学习白皮书V2.0. 腾讯研究院等, 2021。我们以岭回归为例说明纵向联邦学习的训练过程。假设进行联邦学习的数据提供方为。原创 2023-09-07 20:31:45 · 1358 阅读 · 0 评论 -
深入理解联邦学习——联邦学习的分类
在实际中,孤岛数据具有不同分布特点,根据这些特点,我们可以提出相对应的联邦学习方案。下面,我们将以孤岛数据的分布特点为依据对联邦学习进行分类。考虑有多个数据拥有方,每个数据拥有方各自所持有的数据集Di可以用一个矩阵来表示。矩阵的每一行代表一个用户,每一列代表一种用户特征。同时,某些数据集可能还包含标签数据。如果要对用户行为建立预测模型,就必须要有标签数据。我们可以把用户特征叫做X,把标签特征叫做Y。比如,在金融领域,用户的信用是需要被预测的标签Y;在营销领域,标签是用户的购买愿望Y;原创 2023-09-04 20:23:46 · 1717 阅读 · 0 评论 -
深入理解联邦学习——联邦学习与现有理论的区别与联系
作为一种全新的技术,联邦学习在借鉴一些成熟技术的同时也具备了一定的独创性。下面我们就从多个角度来阐释联邦学习和其他相关概念之间的关系。原创 2023-09-04 20:04:47 · 1442 阅读 · 0 评论 -
深入理解联邦学习——联邦学习的价值
联邦学习作为未来AI发展的底层技术,它依靠安全可信的数据保护措施下连接数据孤岛的模式,将不断推动全球AI技术的创新与飞跃。联邦学习技术是一种“合作共赢”的模式,对商业利益而言极具价值。在这样一个联邦机制下,各个参与者的身份和地位相同,而联邦系统帮助大家建立了“共同富裕”的策略。[1] 杨强, 刘洋, 程勇, 康焱, 陈天健, 于涵. 联邦学习[M]. 电子工业出版社, 2020。[2] 微众银行, FedAI. 联邦学习白皮书V2.0[EB/OL]. 腾讯研究院等, 2021。原创 2023-09-04 19:45:55 · 1050 阅读 · 0 评论 -
深入理解联邦学习——联邦学习的定义
联邦学习是要解决这个问题:各个企业的自有数据不出本地,而联邦系统可以通过加密机制下的参数交换方式,即在不违反数据隐私法规情况下,建立一个虚拟的共有模型。这两个企业按照GDPR准则是不能粗暴地把双方数据加以合并的,因为数据的原始提供者,即他们各自的用户并没有机会来同意这样做。上述实例阐述了联邦学习的基本思想,下文将规范联邦学习的定义,介绍联邦学习的公共价值和商业价值,并阐明联邦学习与现有研究的关系。原创 2023-09-04 19:37:24 · 560 阅读 · 0 评论 -
深入理解联邦学习——联邦学习概念的产生
这就是我们面临的现实。所以,过去的许多数据交换的尝试,例如数据交易所的数据交换,也需要巨大的改变才能合规。同时数据源之间存在着难以打破的壁垒,一般情况下人工智能的所需要的数据会涉及多个领域,例如在基于人工智能的产品推荐服务中,产品销售方拥有产品的数据、用户购买商品的数据,但是没有用户购买能力和支付习惯的数据。,由于行业竞争、隐私安全、行政手续复杂等问题,即使是在同一个公司的不同部门之间实现数据整合也面临着重重阻力,在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,或者说所需的成本是巨大的。原创 2023-09-04 19:18:05 · 669 阅读 · 0 评论