AI的力量来自大数据,在现实中能获取的往往是少量数据,例如:
- 在法律领域,获取一个完整的案例样本往往需要很多的时间和资源
- 在金融领域,在风控建模中,如果把反洗钱案例看成正样例,那么这也的正样例数据非常珍贵。
- 在医疗领域,对于罕见疾病,能获得的病例数据少之又少。
而在相关技术使用的过程中,一方面人工智能和大数据技术为人类的发展提供了光明的前景和技术保障;另一方面,人类自身的权益保护又限制了数据按照粗放方式进行简单的汇聚。
在这种背景下,联邦学习应运而生。联邦学习的目的是,不管在面对单个消费者的to C场景,还是面对企业或机构的to B场景,都希望各自的数据可以不出本地,数据集不为其他人所有,保护用户隐私和数据权益。
联邦学习的特点可以总结为两句话:
- “数据不动模型动”,这是联邦学习的核心,让模型在不同机构之间、端和云之间进行沟通交流。
- “数据可用不可见”,这里的不可见,是别人看不见你的数据,你也看不见别人的数据,即模型和数据都保留在本地,建模的过程也保证了数据的安全
本书阐述了联邦学习的原理,同时着重秒速了联邦学习的落地应用实践。
本读书笔记系列针对2021年5月出版的《联邦学习实战》(见下图),后续部分将逐步更新