【论文阅读】BGE Landmark Embedding: 一种用于大语言模型长上下文检索增强的嵌入方法

最新推荐文章于 2024-10-10 16:11:58 发布

bylander

最新推荐文章于 2024-10-10 16:11:58 发布

阅读量2k

点赞数 40

分类专栏： AI论文阅读文章标签：人工智能 chatgpt transformer

本文链接：https://blog.csdn.net/bylander/article/details/137992521

版权

BGELandmarkEmbedding提出了一种无分块的检索方法，通过连续信息处理和位置感知，改善了长上下文语言模型的性能。论文介绍了Chunking-Free架构、位置感知目标函数和多阶段训练策略，显著提升了检索增强在长序列任务中的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

大语言模型（LLM）在面对许多应用时需要能够处理长序列输入，检索增强是处理长上下文语言建模的一种非常有效的方法。然而，现有的检索方法通常与分块的上下文一起工作，这容易导致语义表示质量低下和有用信息检索不完整。今年2月发表的《BGE Landmark Embedding: A Chunking-Free Embedding Method For Retrieval Augmented Long-Context Large Language Models》这篇论文，阐述了一种利用长上下文解决信息不完整检索的方法，通过引入Chunking-Free的检索方法，能够更好地保证上下文的连贯性，并通过在训练时引入位置感知函数来更好感知连续信息段中最后一个句子，保证嵌入依然具备与Sentence Embedding相近的细节，大幅提升了长上下文检索增强的性能。

BGE Landmark Embedding这篇论文要解决的技术问题，更具体的说，在RAG技术中，分块是个麻烦的问题，通常通过经验或启发式方法来解决。但是无论如何，分块打破上下文的连贯性，对嵌入不利，另一方面，连续的信息可能划分到不同的块中，显著的块可以很容易地被检索到，其他有用但不那么显著的块可能被忽视，等等问题。那分块有问题，但是文本太长时又不能不分块，采用滑动窗口就成为一个自然的选择。