自蒸馏技术在语言模型微调中的桥梁作用

OptimaAI

已于 2024-08-15 21:44:55 修改

阅读量879

点赞数 13

分类专栏： LLM论文日更文章标签： nlp 人工智能深度学习语言模型自然语言处理

于 2024-08-05 19:08:25 首次发布

本文链接：https://blog.csdn.net/qq_59084968/article/details/140933493

版权

LLM论文日更专栏收录该内容

31 篇文章 0 订阅

订阅专栏

论文：https://arxiv.org/pdf/2402.13669
代码：https://github.com/sail-sg/sdft
机构：浙江大学、Sea AI Labs和腾讯
领域：模型微调
发表：ACL2024

这篇论文的标题是《Self-Distillation Bridges Distribution Gap in Language Model Fine-Tuning》，作者们探讨了在对大型语言模型（LLMs）进行微调（fine-tuning）以适应特定任务时遇到的挑战，尤其是如何在提升任务性能的同时保留模型的通用指令遵循能力。论文提出了一种新颖的微调方法——自蒸馏微调（Self-Distillation Fine-Tuning，简称SDFT），旨在通过引导微调过程使用模型自身生成的、与其原始分布相匹配的蒸馏数据集来弥合任务数据集和LLMs之间的分布差异。

摘要（Abstract）

大型语言模型（LLMs）在自然语言处理（NLP）领域取得了突破性进展，但微调这些模型以适应特定任务时，常常难以平衡性能和保持通用指令遵循能力。在本文中，认为任务数据集和LLM之间的分布差距是主要原因。
论文提出自蒸馏微调（SDFT）方法，通过模型自身生成的数据集来指导微调，以减少灾难性遗忘（catastrophic forgetting）并保持模型的有用性和安全性。

重写后的response错了怎么办？文章使用了一个简单的策略。对比原本的response和重写后的response中的答案部分，如果不同就仍然使用原本的response。比如，在math reasoning问题上，可以用正则表达式从response中抽取最终的答案，然后比较重写前后的答案是否相同。