传统RAG的架构
传统RAG的整体架构如下图所示:
核心链路分为三个阶段:
- 索引(向量嵌入):通过Embedding模型服务实现文档的向量编码,写入向量数据库。
- 检索(相似查询):通过Embedding模型服务实现查询的向量编码,使用相似性查询(ANN)实现topK结果搜索。
- 生成(文档上下文):Retriver检索的结果文档作为上下文和问题一起提交给大模型处理
传统RAG的缺点
在《Seven Failure Points When Engineering a Retrieval Augmented Generation System》这篇论文中总结了在构建检索增强生成(RAG)系统时开发者常遇到的七个失败点,并针对每个问题提出了改进建议。