LLM如何处理长上下文：Lost in the middle

lichunericli

已于 2024-05-02 16:43:48 修改

阅读量1k

点赞数 28

分类专栏： LLM 文章标签：人工智能自然语言处理

于 2024-03-19 20:25:24 首次发布

本文链接：https://blog.csdn.net/lichunericli/article/details/136854003

版权

研究表明，尽管大型语言模型能处理长上下文，但它们在处理中部信息时表现不佳，更关注开头和结尾部分。论文通过多文档问答和键值检索任务揭示了模型在长上下文中的信息检索问题，提出模型性能与输入信息位置存在U型关系。

摘要由CSDN通过智能技术生成

论文地址：Lost in the Middle: How Language Models Use Long Contexts

论文总结：写prompt的时候，需要注意内容的顺序，把重要的信息放在最前面或者最后面。

大型语言模型大有用处，在设计 prompt 方面，人们通常建议为语言模型提供详尽的任务描述和背景信息。

近期的一些语言模型有能力输入较长的上下文，但它究竟能多好地利用更长的上下文？这一点却相对少有人知。

近日，斯坦福大学、加州大学伯克利分校和 Samaya AI 的研究者发布了一篇实证研究论文，探究了这个问题。

结论令人意外：如果上下文太长，语言模型会更关注其中的前后部分，中间部分却几乎被略过不看，导致模型难以找到放在输入上下文中部的相关信息。

他们对多种不同的开源（MPT-30B-Instruct、LongChat-13B (16K)）和闭源（OpenAI 的 GPT-3.5-Turbo 和 Anthropic 的 Claude）的语言模型进行了对照实验 —— 实验中需要模型获取并使用输入上下文中的信息。

研究者首先实验了多文档问答，该任务需要模型基于多个文档进行推理，以找到相关信息并将其用于回答给定问题。这个任务模拟了检索增强式生成任务，其是许多商用生成式搜索和问答应用（如 Bing Chat）的基础。在实验中，他们的做法是改变输入上下文长度和输入上下文中相关信息的位置，然后对照比较输出结果的表现。

更详细地说，研究者通过向输入上下文添加更多文档来增大输入上下文的长度（类似于在检索增强式生成任务中检索更多文档）；以及通过修改输入上下文中文档的顺序，将相关信息放置在上下文的开头、中间或结尾，从而修改上下文中相关信息的位置。

实验中，研究者观察到，随着相关信息位置的变化，模型性能呈现出明显的 U 型趋势，如图 1 所示。也就是说，当相关信息出现在输入上下文的开头或末尾时，语言模型的性能最高；而当模型必须获取和使用的信息位于输入上下文中部时，模型性能会显著下