1 背景介绍
1.1 人工智能的遇到的困境
(1)数据孤岛问题。一个AI项目可能涉及多个领域,需要融合各个公司、各个部门的数据。(比如研究居民线上消费问题,需要各个消费平台的数据,可能还需要银行数据等等)但在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的。
(2)数据隐私问题。GDPR的出台,使得各方对数据所有权和隐私性的关注越来越多,对用户隐私和安全管理日趋严格,拿不到赖以生存的数据集。
GDPR:2018年欧洲联盟出台《通用数据保护条例》。旨在保护用户的个人隐私和数据安全。用户可以删除或撤回其个人数据 没有用户的允许,公司的不可以有其它用途。违反该法案的公司将面临高额罚款。
1.2数据隐私保护可解决方案
(1)要解决大数据的困境,仅仅靠传统的方法已经出现瓶颈。两个公司简单的交换数据,法规、GDPR都是不允许的;用户是原始数据的拥有者,在用户没有批准的情况下,公司间不能交换数据。
(2)如何在满足隐私监管要求的前提下,设计一个机器学习框架。让数据拥有方不暴露自己的数据,但能共同使用数据,。让人工智能系统能够更加高效、准确地共同使用各自的数据,解决数据孤岛的问题。因此,一个满足隐私保护和数据安全的一个可行的解决方案就诞生了 ,即 联邦学习。