【论文阅读】Federated Large Language Model : A Position Paper

最新推荐文章于 2024-06-27 16:40:55 发布

只说人话绝不装逼

最新推荐文章于 2024-06-27 16:40:55 发布

阅读量423

点赞数

分类专栏：联邦大模型文章标签：论文阅读语言模型人工智能

本文链接：https://blog.csdn.net/AlexFaker/article/details/134393791

版权

联邦大模型专栏收录该内容

1 篇文章 1 订阅

订阅专栏

https://arxiv.org/pdf/2307.08925.pdf
这篇文章算是一篇position paper，阐述了作者对联邦大模型的理解与看大。初学者可以当一篇综述来看。文章思想很朴素，也很容易理解，基本就是有大模型基础和联邦学习基础的人都能想到或是理解的。

联邦大模型的两种学习方式

两种非常直观的方法：一种是从头训练，一种是利用私有数据集进行微调。优劣也非常直观：第一种方法允许特定任务的模型设计和潜在的优越性能，但需要更高的计算和通信成本。另一方面，第二种方法减少了开销，但可能会牺牲一定程度的任务适应性。
a图为从头开始的与训练，b图为私有数据微调

联邦微调

联邦微调是微调阶段进行联邦学习，也就是模型不但可以用本地数据进行个性化微调，还可以习得其余客户端的知识。微调有两种思路：一种是直接微调（就是最传统的fedavg式的微调），另一种是用一些微调技术，比如adapter tuning, prefix tuning, prompt tuning, and low-rank adaptation (LoRA).

联邦大语言模型提示工程（ Federated LLM Prompt Engineering）

啥是提示工程（promote engineering）？我问chatgpt居然不知道。。。看来是个新词，学术界的造词能力真强啊。
在这里插入图片描述
提示工程（Prompt Engineering）是一门较新的学科，关注提示词开发和优化，帮助用户将大语言模型（Large Language Model, LLM）用于各场景和研究领域。
简单讲，就是我们该怎么提问，大模型才能给出更好的输出？大模型不是人，本质还是输入输出的对应，我们的提问方式变一变，哪怕从人类的理解上提问的内容是一样的，但模型很有可能给出不同的输出。

传统的提示工程都是在公开数据集上操作，这可能很难引导模型做出非常个性化的回答。联邦学习利用了很多私域数据，这使得在提示学习中可以习得与私域数据相关联的提示词。
关于联邦提示学习，可以参考论文：《PROMPTFL: Let Federated Participants Cooperatively Learn Prompts Instead of Models — Federated Learning in Age of Foundation Mode》