联邦学习
背景
人工智能技术的实现
数据量少,数据质量差的问题,不足以支撑人工智能技术的实现
隐私保护问题,数据也往往以孤岛形式出现
概念
本质是一种分布式机器学习技术,在人工智能领域可以认为是一个机器学习框架
目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升AI模型的效果
根据数据分布不同分三个类
横向联邦学习
本质是样本的联合
特征重叠多
用户重叠少
比如不同地区的银行间,他们的业务相似(特征相似),但用户不同(样本不同)
可以看作是基于样本的分布式模型训练
- 每台机器下都是相同且完整的模型
- 预测时每台机器也可以独立预测
谷歌最初就是采用横向联邦的方式解决安卓手机终端用户在本地更新模型的问题的。
纵向联邦学习
本质是特征的联合
适用于用户重叠多,特征重叠少的场景
在整个过程中参