清华&CMU：LLM多阶段自我合成数据

大模型任我行

于 2024-08-27 19:00:00 发布

阅读量553

点赞数 9

分类专栏：大模型-指令建设文章标签：人工智能自然语言处理语言模型

本文链接：https://blog.csdn.net/weixin_46739757/article/details/141565607

版权

3 篇文章 0 订阅

订阅专栏

在这里插入图片描述

📖标题：SELF-GUIDE: Better Task-Specific Instruction Following via Self-Synthetic Finetuning
🌐来源：arXiv, 2407.12874（被COLM2024接收）

🛎️文章简介

🔸研究问题：如何通过自我合成数据来提高大语言模型（LLM）在特定任务的指令遵循能力。
🔸主要贡献：论文提出了SELF-GUIDE框架，通过自我合成训练数据并在此数据上进行微调，使得LLM能够更好地理解和遵循特定任务的指令。

🔸手工制作的数据集在监督和增强各种NLP任务发挥了关键作用，当前研究用LLM来合成数据降低成本。
🔸尽管LLM合成的数据存在噪音，但仍然可以作为指令微的有效训练资源，这意味着预训练LLM的参数知识包含了指令理解能力。
🔸当前的指令合成，对种子数据、人工管理和教师模型都存在一定的依赖性。

🔸输入生成：根据任务类型设置提示模板，将种子示例输入提示模板生成指令，经过规则筛选。
🔸输出生成：采用传统的上下文学习技术，给定指令生成对应的输出，经过规则筛选。
🔸质量优化：通过调整各种超参数，包括生成输入的初始数量、输入生成的温度、输出生成的温度、训练时期等参数，以便提高数据生成质量。

🔸SELF-GUIDE在分类和生成任务上，都优于传统的小样本学习。
🔸利用合成数据方面，微调要优于上下文学习。
🔸SELF-GUIDE不仅学习表面的输出格式和标签结构，还能更深入地理解任务本身。
🔸噪声过滤对于分类任务至关重要，而长度过滤对于生成任务至关重要。

论文利用LLM的自我生成能力来减少对外部资源的依赖，并通过自我合成微调提高模型在特定任务上的表现。

在这里插入图片描述

关注