LLM之RAG理论(四)| RAG高级数据索引技术

本文探讨了2023年RAG系统中分块技术的改进、数据检索技术的飞跃发展,包括查询增强、层次结构和知识图谱的应用。重点在于如何通过这些技术提高数据相关性和检索效率,以实现更精准的信息处理和回答用户查询。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        本文将重新审视分块技术以及其他方法,包括查询增强层次结构知识图谱

一、简单RAG架构快速概览

       在2023年年初,我的主要关注点集中在Vector DB及其在更广泛的设计领域中的表现上。然而,随着2023年的收尾,这一领域出现了重大进展。在RAG系统的设计中,需要考虑以下一些事情:

  • LLM模型领域正在进行的开源和开源之间的斗争,那么在实际使用中最好的模型是什么?
  • 应该微调LLM还是直接对数据集进行嵌入?
  • 文件处理有了新的突破。之前仅依靠文档块,现在拥有一系列技术,包括层次结构句子窗口自动合并等。
  • 数据检索技术也突飞猛进。今年年初,只使用了k-相似性技术,现在我们有递归混合搜索重新排序元数据过滤器多智能体等。

图片

那么,是什么造就了一个好的数据检索系统呢?

两个词:相关性和相似性。

       相关性是指检索到的信息与用户的查询相关的相关性或重要性,而相似性在数据检索的上下文中是指用户的查询与可用数据之间的相似性或相似性。

similarity = word matching,relevancy = context matching.

       矢量数据库有助于识别语义相近的内容(相似性),但识别相关性或检索相关内容更复杂的方法(可以参考:https://www.youtube.com/watch?v=TRjq7t2Ms5I)。

图片

二、高级数据处理实现更好的数据检索

2.1 分块策略

       在自然语言处理的背景下,“分块”是将文本分解为可管理、清晰和重要的块的过程。在这种情况下,使用较小的文本片段而不是较大的文档可以使RAG系统更快、更准确地发现相关上下文。

       确保选择的分块是合适的,这对分块策略的成功至关重要。这些文本段落的水平和组织对这种策略的效果有很大影响。为了找到和提取捕捉RAG系统所需的基本细节或上下文的文本段落,需要仔细检查内容和上下文。智能分块策略提高了系统遍历和理解自然语言的能力,最终实现了更准确、更有效的信息处理。

        在本文中,块大小为1024似乎会产生更好的结果

图片

       较大的块可以捕获更多的上下文,但由于它们产生的噪声,处理它们需要更长的时间和更多的钱。虽然较小的片段可能无法完全传达必要的上下文,但它们的噪音确实较小。平衡这两个要求的一种方法是具有重叠部分。组合块的查询可能能够从各种向量中获得足够的相关信息,以产生适当的上下文化答案。

2.2 这种策略有什么不好的地方?<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wshzd

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值