- 博客(4)
- 收藏
- 关注
原创 从零开始解析RAG(四):索引优化——多表示、分层与嵌入
本文探讨索引阶段的优化技巧,主要聚焦于 3 种方法:对同一文档生成多种表示的形式的多表示索引,构建分层索引的 Raptor 以及基于 token 嵌入的ColBERT。下一篇文章将探讨检索阶段的优化技巧,敬请期待。
2025-03-19 16:45:14
2036
原创 从零开始解析RAG(三):五级分块——从字符切分到语义感知的演进之路
大家好,这是我们 RAG 系列的第三篇文章,前两篇文章分别从 Query 优化的角度,介绍了通过翻译问题来改进检索质量的查询翻译,为问题选择合适数据源的路由选择,以及面向结构化数据,非结构化数据的查询构建。从优化整个 RAG 的角度来说,下一步,我们要优化索引。加载文档分块嵌入保存到向量数据库这是一般的索引过程。文档加载自不必说,一个准备过程,从第 2 步分块开始,才真正影响索引的结果。因此,本篇文章将聚焦于构建索引的第一阶段——文本分块,从易到难介绍 5 个级别的分块。
2025-03-17 15:31:25
2181
原创 从零开始解析RAG(二):路由与查询构建——让数据主动响应问题
本文主要探讨了 RAG 中路由决策和查询构建的方法。路由决策包括逻辑路由和语义路由,逻辑路由基于规则和推理,语义路由依据语义相似性。查询构建针对不同数据结构,重点关注自检索器中的元数据过滤。
2025-03-09 23:54:59
1125
原创 从零开始解析RAG(一)—— 从基本RAG迈入高级RAG
本文从 LLM 面临的问题引出 RAG,介绍了其基础流程,重点阐述了高级 RAG 中的 Query Translation 方法。包括基本 RAG 的索引、检索、生成阶段,以及 Query Translation 的多个优化方向,如 Multi-Query、RAG-Fusion、Decomposition、Step-back Prompting、HyDE 等,这些方法通过优化 query 来提高检索质量,文末提及下篇将介绍路由等优化手段。
2025-03-09 23:53:26
1914
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人