自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 从零开始解析RAG(四):索引优化——多表示、分层与嵌入

本文探讨索引阶段的优化技巧,主要聚焦于 3 种方法:对同一文档生成多种表示的形式的多表示索引,构建分层索引的 Raptor 以及基于 token 嵌入的ColBERT。下一篇文章将探讨检索阶段的优化技巧,敬请期待。

2025-03-19 16:45:14 2036

原创 从零开始解析RAG(三):五级分块——从字符切分到语义感知的演进之路

大家好,这是我们 RAG 系列的第三篇文章,前两篇文章分别从 Query 优化的角度,介绍了通过翻译问题来改进检索质量的查询翻译,为问题选择合适数据源的路由选择,以及面向结构化数据,非结构化数据的查询构建。从优化整个 RAG 的角度来说,下一步,我们要优化索引。加载文档分块嵌入保存到向量数据库这是一般的索引过程。文档加载自不必说,一个准备过程,从第 2 步分块开始,才真正影响索引的结果。因此,本篇文章将聚焦于构建索引的第一阶段——文本分块,从易到难介绍 5 个级别的分块。

2025-03-17 15:31:25 2181

原创 从零开始解析RAG(二):路由与查询构建——让数据主动响应问题

本文主要探讨了 RAG 中路由决策和查询构建的方法。路由决策包括逻辑路由和语义路由,逻辑路由基于规则和推理,语义路由依据语义相似性。查询构建针对不同数据结构,重点关注自检索器中的元数据过滤。

2025-03-09 23:54:59 1125

原创 从零开始解析RAG(一)—— 从基本RAG迈入高级RAG

本文从 LLM 面临的问题引出 RAG,介绍了其基础流程,重点阐述了高级 RAG 中的 Query Translation 方法。包括基本 RAG 的索引、检索、生成阶段,以及 Query Translation 的多个优化方向,如 Multi-Query、RAG-Fusion、Decomposition、Step-back Prompting、HyDE 等,这些方法通过优化 query 来提高检索质量,文末提及下篇将介绍路由等优化手段。

2025-03-09 23:53:26 1914

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除