联邦学习：概念与应用

最新推荐文章于 2024-08-22 22:48:39 发布

狗狗GoGoGo_

最新推荐文章于 2024-08-22 22:48:39 发布

阅读量2.2k

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/ishandsomedog/article/details/105909300

版权

联邦学习是一种在不交换数据的情况下，通过安全多方计算、差分隐私和同态加密技术，实现多个机构间协作的机器学习框架。它旨在解决数据孤岛和隐私保护问题，适用于横向、纵向和迁移学习场景，已应用于金融风控、智慧零售和医疗健康等领域。联邦学习的特点包括数据保留在本地、多方共赢和模型效果接近传统深度学习。然而，它还面临通信效率、联盟管理和技术挑战等问题。

摘要由CSDN通过智能技术生成

论文：Q. Yang, Y. Liu, T. Chen, and Y. Tong, “Federated machine learning: Concept and applications,” ACM Trans. Intell. Syst. Technol., vol. 10, no. 2, pp. 1–19, 2019, doi: 10.1145/3298981.

伴随着计算力、算法和数据量的巨大进步，人工智能迎来第３次发展高潮，开始了各行业的落地探索。然而，在“大数据”兴起的同时，更多行业应用领域中是“小数据”或者质量很差的数据，“数据孤岛”现象广泛存在。例如在信息安全领域的应用中，虽然多家企业推出了基于人工智能技术的内容安全审核、入侵检测等安全服务，但出于用户隐私和商业机密的考虑，企业之间很难进行原始数据的交换，各个企业之间服务是独立的，整体协作和技术水平很难在短时间内实现突破式发展。如何在保护各机构数据隐私的前提下促成更大范围的合作，能否通过技术手段破解数据隐私保护难题，联邦学习是解决这一问题、实现跨企业协同治理的有效方式。

联邦学习指的是在满足隐私保护和数据安全的前提下，设计一个机器学习框架，使各个机构在不交换数据的情况下进行协作，提升机器学习的效果。其核心就是解决数据孤岛和数据隐私保护的问题，通过建立一个数据“联邦”，让参与各方都获益，推动技术整体持续进步。

联邦学习具有以下特点：

各方数据都保留在本地，不泄露隐私也不违反法规。
多个参与者联合数据建立虚拟的共有模型，实现各自的使用目的，共同获益。
在联邦学习的体系下，各个参与者的身份和地位相同。
联邦学习的建模效果类似于传统的深度学习。
“联邦”就是数据联盟，不同的联邦有着不同的运算框架，服务于不同的运算目的。如金融行业和医疗行业就会形成不同的联盟。

安全多方计算理论

姚期智教授提出了著名的”百万富翁“问题：两个富翁在不暴露自己财富的情况下，如何知道到底谁更富有。因此，安全多方计算理论（Secure Muti-party Computation，SMC）应运而生，用以解决互不信任的参与方之间的协同计算问题。

差分隐私

差分隐私（Differential Privacy，DP）保护是基于数据失真的隐私保护技术，采用对数据添加噪声的方式来模糊数据，掩盖敏感数据信息，使数据无法被还原。差分隐私保护理论降低了数据泄露的风险，且操作简单，不受数据量大小的限制，因此曾吸引国内外诸多学者参与到差分隐私保护的研究中，也催生出一些列的差分隐私方法。