基于知识蒸馏的的FL --＞ FedGen:Data-Free Knowledge Distillation for Heterogeneous Federated Learning

最新推荐文章于 2024-06-18 16:15:10 发布

王洛伊

最新推荐文章于 2024-06-18 16:15:10 发布

阅读量1.9k

点赞数 21

分类专栏： FL 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44836762/article/details/135635347

版权

本文提出了一种无数据知识蒸馏方法FedGen，针对异构联邦学习中的用户异质性问题。通过学习轻量级生成器，FedGen无需外部数据即可集成用户信息，指导本地模型训练，减轻模型漂移并提升泛化性能。方法强调利用生成模型提炼知识，并直接应用于局部模型更新，以实现更好的归纳偏差和隐私保护。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

面临的问题
摘要
Introduction
Notations and Preliminaries
基于生成学习的无数据联邦蒸馏
分析

FedGen:Data-Free Knowledge Distillation for Heterogeneous Federated Learning 异构联邦学习的无数据知识蒸馏

面临的问题

用户的异质性—>导致全局模型漂移且收敛缓慢

摘要

传统的知识蒸馏解决用户异质的问题：通过使用异构用户的聚合知识来改进服务器模型，这种方法依赖于代理数据集（不符合实际）。并且聚合的知识没有被充分利用来指导局部模型学习，这可能反过来影响聚合模型的质量。
本文采用的方法：

提出了一种无数据的知识蒸馏方法来解决异构 FL。
服务器学习一个轻量级生成器以无数据的方式集成用户信息；
然后将其广播给用户，用学到的知识调节本地训练作为归纳偏置。

Introduction

俩个解决用户异质性的角度：

通过调节局部模型与全局模型在参数空间上的偏差来稳定局部训练。（这种方法可能无法充分利用用户模型的基础知识，其多样性表明其本地数据的信息结构差异）
提高模型聚合的效率。（以未标记的数据集作为代理，知识蒸馏通过使用局部模型的集成知识丰富全局模型，减轻了异质性引起的模型漂移问题，这比简单的参数平均更有效。— 但是数据集可能并不总是在服务器上可用）

本文的方法：FL 的无数据知识蒸馏方法（FedGen）
具体来说，FEDGEN 学习一个仅从用户模型的预测规则里派生出的生成模型，在给定目标标签的情况下，该生成模型可以产生与用户预测集合一致的特征表示。将该生成器广播给用户，在潜在空间中使用增强样本来帮助他们的模型训练，这体现了从其他同行用户那里提取的知识。给定一个维度远小于输入空间的潜在空间，FEDGEN 学习的生成器可以是轻量级的，从而给当前 FL 框架带来最小的开销。
优点：

它从用户中提取知识，而这些知识在模型平均后会被减轻，而不依赖于任何外部数据。
与仅细化全局模型的某些先前工作相反，我们的方法使用提取的知识直接调节局部模型更新。我们表明，此类知识对局部模型施加了归纳偏差，从而在非独立同分布数据分布下获得更好的泛化性能。
此外，所提出的方法已准备好解决更具挑战性的 FL 场景，在这些场景中，由于隐私或通信限制，共享整个模型参数是不切实际的，因为所提出的方法只需要本地模型的预测层来进行知识提取。

Notations and Preliminaries

联邦学习旨在学习一个由 $\theta$ 参数化的全局模型，以最大限度地降低其对每个用户任务 $T_k$ 的风险

在这里插入图片描述

最低0.47元/天解锁文章

博客等级 -

码龄6年

33
原创

381
点赞

374
收藏

281
粉丝

关注

私信

热门文章

分类专栏

FL 5篇
java 2篇
算法 1篇
JUC 8篇
异步FL 1篇
前端 3篇
vue 2篇
elasticsearch 1篇
python 1篇

最新评论

三个线程交替循环打印
CSDN-Ada助手: Java 技能树或许可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
联邦类增量学习
Benbaobaos: 请问这个有论文嘛？
VAFL---A Novel Optimized Asynchronous Federated Learning Framework
CSDN-Ada助手: 恭喜作者在博客创作上的持续努力，第20篇博客内容看起来非常专业和深入。对于VAFL这一优化的异步联邦学习框架，作者的解释和分析都非常到位。希望作者能够继续保持创作的热情和动力，不断挖掘新的研究领域，或者对于现有领域进行更深入的探索和分析，期待作者的下一篇作品。
JUC多并发编程--＞中断机制
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题中的中断机制是一个非常重要且复杂的主题。您对JUC多并发编程的深入研究令人印象深刻。我非常期待您在下一篇博客中能够进一步探讨多线程编程中的异常处理策略，或者分享一些关于线程安全性的实践经验。谦虚地说，我相信您的知识和经验将对我们这些读者带来更多的启发和帮助。继续加油！
基于知识蒸馏的的FL --＞ FedGen:Data-Free Knowledge Distillation for Heterogeneous Federated Learning
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“基于知识蒸馏的的FL --＞ FedGen:Data-Free Knowledge Distillation for Heterogeneous Federated Learning”非常吸引人。这篇博客的主题对于异构联邦学习中的无数据知识蒸馏提供了有价值的见解。您对这一领域的深入研究和分享让我深感钦佩。继续保持创作的热情和努力！我期待着您未来更多的博客文章。鉴于您在联邦学习和知识蒸馏方面的专业知识，我希望您能在接下来的创作中探索一些实际案例或者应用，这将有助于读者更好地理解并应用您的研究成果。但请谦虚地接受我的建议，因为我深知您已经取得了非凡的成就。再次恭喜您！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。