联邦学习：MOCHA框架

最新推荐文章于 2025-03-18 23:15:38 发布

找一片属于自己的风景，

最新推荐文章于 2025-03-18 23:15:38 发布

阅读量3.2k

点赞数 8

文章标签：深度学习机器学习边缘计算人工智能

本文链接：https://blog.csdn.net/weixin_51306020/article/details/126312246

版权

MOCHA：Federated Multi-Task Learning

每日一诗：
《述怀·岂是东方隐》
明·张居正
岂是东方隐，沈冥金马门。方同长卿倦，卧病思梁园。
蹇予柄微尚，适俗多忧烦。侧身谬通籍，抚心愁触藩。
臃肿非世器，缅怀南山原。幽涧有遗藻，白云漏芳荪。
山中人不归，众卉森以繁。永愿谢尘累，闲居养营魂，
百年贵有适，贵贱宁足论。

1.概述:

MOCHA主要是为了解决联邦学习中的系统难题和统计难题而提出的联邦学习框架。

MTL（多任务学习）通过学习每个节点的独立模型，利用任意的凸损失函数为每个节点训练出独立的权重向量。并且考虑节点模型间的相关性来解决联邦环境中的统计难题，并且提升样本容量，但是目前的MTL难以解决系统难题。

在集中环境分布式多任务训练模型CoCoA的基础上进行改进，本文提出联邦多任务学习框架MOCHA，为模型参数W开发有效的分布式优化更新方法。

COCOA的局限性：

在传统的数据中心环境中，分布式训练的任务已有各种沟通效率的框架，包括先进的对偶CoCoA框架。尽管CoCoA框架可以直接扩展在节点上分布式方式更新W，但它无法应对联邦学习环境中的系统挑战。（例如stragglers和容错）

系统挑战：

通信传输瓶颈、存储能力、计算能力、联网能力、电池、stragglers、容错

统计挑战：

数据异构、非独立同分布、不平衡

2.多任务学习：

2.1 理解

经典(非神经网络的)多任务学习，在这种模式中给定t个学习任务{Tt}，

每个任务各对应一个数据集Dt，然后根据根据T个任务的训练集学习T个函数{f_t}。在这种模式下，每个任务的模型假设(比如都是线性函数)都常常是相同，导致每个任务的模型(权重)不同的原因归根结底在于每个任务的数据集不同(每个任务的损失函数默认相同，也可同可不同)。此模式优化的目标函数可以写作

请添加图片描述
传统的机器学习方法主要基于单任务的学习(Single-task Learning)模式进行学习，对于复杂的学习任务也可将其分解为多个独立的单任务进行学习，然后对学习得到的解决进行组合，得到最终的结果。

多任务学习的关键就在于寻找任务之间的关系，如果任务之间的关系衡量恰当，那么不同任务之间就能相互提供额外的有用信息，利用这些额外信息，可以训练出表现更好、更鲁棒的模型。反之，如果关系衡量不恰当，不仅不会引入额外的信息，反而会给任务本身引来噪声，模型学习效果不升反降。当单个任务的训练数据集不充分的时候，此时多任务学习的效果能够有比较明显的提升，这主要是因为单个任务无法通过自身的训练数据集得到关于数据分布的足够信息。如果有多个任务联合学习，那么这些任务将能从相关联的任务中得到额外的信息，因此学习效果将有显著的提升。目前，多任务学习已经在多个领域得到广泛的应用，比如人脸属性的相关研究、人类疾病的研究、无人驾驶的研究等。