SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions

最新推荐文章于 2024-10-04 22:36:54 发布

UnknownBody

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量647

点赞数

文章标签：语言模型人工智能深度学习

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/133885057

版权

LLM 日更专栏收录该内容

516 篇文章 3 订阅

已下架不支持订阅

SELF-INSTRUCT 是一种利用语言模型自身生成指令数据来增强其指令执行能力的框架。研究发现，通过该方法微调后的GPT3在SUPERNATURALINSTRUCTIONS上的性能提高了33%，与使用人工注释的InstructionGPT001相当。此方法提供了一种几乎无需标注的数据方式，以提升预训练语言模型的指令对齐效果。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions》的翻译。

摘要

大型“指令调整”语言模型（即，微调以响应指令）已经证明了将零样本推广到新任务的显著能力。然而，它们在很大程度上依赖于人类书面指令数据，而这些数据在数量、多样性和创造性方面往往是有限的，因此阻碍了调优模型的通用性。我们介绍了SELFINSTRUCT，这是一个通过自举自己的生成来提高预训练语言模型的指令跟随能力的框架。我们的管道从语言模型中生成指令、输入和输出样本，然后过滤无效或类似的样本，然后使用它们来微调原始模型。将我们的方法应用于普通的GPT3，我们证明了在SUPERNATURALINSTRUCTIONS上比原始模型有33%的绝对改进，与使用私人用户数据和人工注释训练的InstructionGPT001的性能相当。为了进一步评估，我们为新任务策划了一组专家书面指令，并通过人工评估表明，使用SELF-instruction调整GPT3的性能大大优于使用现有公共指令数据集，仅与InstructionGPT001相差5%的绝对差距。SELF-instruction提供了一种几乎无注释的方法，用于将预训练的语言模型与指令对齐，我们发布了我们的大型合成数据集，以促进未来对指令调整的研究

了解本专栏