用魔法打败魔法 Prompt2Model：大模型辅助小模型

最新推荐文章于 2024-06-30 19:41:16 发布

zenRRan

最新推荐文章于 2024-06-30 19:41:16 发布

阅读量219

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247522024&idx=1&sn=37aaed92718e4b9825c7592edf7f757f&chksm=eb53827bdc240b6d9a1a3df3cef7b398fcbe6cfddbe61b538ab75a9fe59b128cbb73da9da5be&scene=126&sessionid=0

版权

知乎：养生的控制人(已授权)
深度学习自然语言处理分享
链接：https://zhuanlan.zhihu.com/p/653647768

大模型在各方面的表现都还可以，但是在很多垂直领域反而是一种浪费，因为很多时候我们并不需要它是个通才，只需要专注于特定任务。今天分享一篇文章，主要思想就是借助LLM来辅助训练一个特定任务的小模型。

论文：PROMPT2MODEL: Generating Deployable Models from Natural Language Instructions
地址：https://arxiv.org/abs/2308.12261

进NLP群—>加入NLP交流群

本文提出了一种名为Prompt2Model的框架，它可以接受自然语言任务描述，然后训练一个特定目的且便于部署的模型。该方法结合了检索现有数据集、预训练模型、使用LLM生成数据集，并在这些数据上进行微调。实验结果显示，与gpt-3.5-turbo相比，Prompt2Model训练的模型性能提高了20%，但模型大小减少了700倍。

Prompt2Model框架

数据集检索：根据任务相关性收集训练数据
数据集生成：利用LLM（称为“教师模型”）生成伪标签数据集，进而训练一个“学生”模型来模仿教师模型
模型检索：根据提示选择一个预训练的语言模型，进一步微调和评估

详细步骤

1. 提示解析

目的：将用户提供的提示分为“指令”和“示范”两部分。
方法：使用LLM（在实验中为gpt-3.5-turbo-0613）进行上下文学习，对用户提示进行分段。如果指令是非英语的，将其使用DeepL API翻译成英语。

2. 数据集检索器

目的：为给定的提示找到相关的数据集。
方法：采用Viswanathan等人(2023)引入的DataFinder系统。通过提取Hugging Face Datasets中的用户生成的数据集描述，使用DataFinder的双编码器检索器对数据集进行排序。用户可以从前k个数据集中选择最相关的数据集或指定没有合适的数据集，并指定数据集模式中的输入和输出列。

3. 数据集生成器

目的：快速、低成本地生成高质量的样本。
方法：
- 高多样性的少量提示：使用自动提示工程生成多样的数据集，增加用户提供的示例与随机样本，以增加多样性并避免重复。
- 温度退火：根据已生成的示例数量，从低到高调整采样温度，以鼓励多样性。
- 自洽解码：使用自洽过滤来选择伪标签，为每个独特的输入创建一个共识输出。
- 异步批处理：使用zeno-build并行化API请求，并使用动态批处理大小和节流机制优化API使用。